New York Times, İç Gelir Servisi’nin en sıkı denetim türlerinden birini eski FBI direktörü James B. Comey’e ve eski yardımcısı Andrew G. McCabe’ye verdiğini bildirdi.
Bu, pek çok makul soruya yol açtı, bunların çoğu varyantları: Olasılıklar nelerdir? Makalenin belirttiği gibi, Başkan Donald J. Trump’ın iki yüksek rütbeli siyasi düşmanının tamamen tesadüf tarafından denetlenmiş olma şansı çok küçük.
Ama ufacık sıfır değildir.
Bunun bir tesadüf olduğuna inanmak isteseydik, bunun ne kadar imkansız olduğunu söylerdik? Burada, bu olasılığı elimizden geldiğince ciddi bir şekilde tahmin etmeye çalışıyoruz.
Birincisi, gerçekler: Her iki adam da, IRS’nin her yıl gerçekleştirdiği tüm denetimlerin küçük bir alt kümesi olan Ulusal Araştırma Programı (NRP) kapsamındaki denetimler için seçildi. Bu denetimler, vergi uyumu hakkında veri toplamak için bir beyanname örneğini inceler.
IRS’ye göre, her yıl yaklaşık 154 milyon bireysel vergi beyannamesi arasından seçilen, 2017’de yaklaşık 5.000, 2018’de 4.000 ve 2019’da 8.000 bu tür denetim vardı. Bay Comey’in denetimi, 2017 vergi beyannamesi içindi; Bay McCabe, 2019 dönüşü içindi.
NRP’nin birçok yönü, IRS denetçilerinin örnekleme metodolojisi ve denetimlerin farklı yılları da dahil olmak üzere hesaplamalarımızı karmaşıklaştırmaktadır. Bu konulara daha sonra döneceğiz. Şimdilik, tüm vergi mükelleflerinin eşit denetlenme şansına sahip olduğunu ve her iki erkeğin de 2017’de denetlendiğini varsayacağız.
Bu sorun olasılık hakkındaki bir ders kitabında geçseydi, şöyle olabilirdi:
Dev bir vazoda 154 milyon bilye varsa (her yıl verilen yaklaşık vergi beyannamesi sayısı) ve bunların az bir kısmı kırmızıysa (bunlar arasında Bay Comey ve Bay McCabe’yi temsil edenler), siz olma ihtimaliniz nedir? urn’dan rastgele birkaç bin çekerseniz iki veya daha fazla kırmızı bilye çekecek mi (o yıldaki denetim sayısı)?
Kulağa karmaşık gelebilir, ancak nispeten iyi çalışılmış bir sorundur, birçok matematik veya istatistik bölümünün üniversite derslerinde karşılaşacağı bir şeydir. İnsanlar, seçim denetimi ve kart sayma gibi uygulamaları olan hipergeometrik dağılım gibi isimlerle bu olasılıkları tahmin etmek için denklemler türetmiştir.
Toplam bilye sayısı, kırmızı bilye sayısı ve çekiliş sayısı için tahminlerimizi basitçe girebiliriz ve bir olasılık elde ederiz. Yalnızca iki kırmızı bilye olduğuna inanırsak, yani alıştırmayı şu şekilde sınırlarsak: sadeceBay McCabe ve Bay Comey — bu denklem kabaca 950 milyonda bir olasılık verir.
Bunlar, Powerball kazanma şansınızdan çok daha yüksek oranlardır. Aynı zamanda neredeyse anlamsız bir sonuçtur. En iyi ihtimalle, yanlış soruya doğru cevaptır.
Neden uygulamamızın doğasında var olan bir saçmalığı kabul etmeyi gerektirdiğini anlamak için: Olasılık dışı bir olayın olasılığını en iyi şekilde tahmin etmek için, bunun zaten olduğunu bildiğimiz gerçeğini bir kenara bırakmalıyız. (Olma olasılığı yüzde 100’dür.)
Matematik ve akıl yürütme hakkında kitaplar yazan Wisconsin Üniversitesi’nde profesör olan Jordan Ellenberg, bunu şu şekilde tanımladı: “Karşı-olgusal bir evrende, bizim evrenimizde zaten olmuş olan bu şeyin olma olasılığı nedir?”
Tuhaf görünebilir, ancak aynı sorunlar yazı tura atmak kadar basit olasılıklı alıştırmalarda bile ortaya çıkıyor.
Bir madeni parayı arka arkaya 20 kez atarsanız, belirli yazı ve tura diziniz olağanüstü derecede nadirdir, milyonda bir, ama oldu. Ve bazı çevirme sırası her zaman olacaktır. Bu şaşırtıcı bir tesadüf, ancak ters çevirmeden önce elde etmek için yola çıktığınız sıra buysa.
Aynı şekilde, aramamızı yalnızca Bay Comey ve Bay McCabe ile sınırlandırmak yanlıştır, çünkü iki olasılık olduğunu öğrenseydik, büyük olasılıkla bu olasılıkları inceliyor olurduk. başkaBu iki adam yerine bir yönetimin önemli siyasi düşmanları denetlendi.
Daha iyi bir soru şudur: İki veya daha fazla kişinin beğenmekBay Comey ve Bay McCabe bu süre içinde denetlenecek mi?
Bu insan grubu herhangi iki üst düzey FBI yetkilisini içermeli mi? İki üst düzey Adalet Bakanlığı yetkilisi var mı? Herhangi bir olasılık tahminini, herhangi bir istatistiksel dağılım veya örnekleme ağırlığı seçiminden daha fazla yönlendiren, bu çerçevelemedir – olgusal bir karardan ziyade öznel bir karardır -.
İşte denklemimizin iki (Bay Comey ve Bay McCabe ve başka kimse yok) ile 400 (Amerikalı Bay Trump sayısının muhafazakar bir tahmini) arasında değişen kırmızı bilye sayısı için farklı seçeneklerde verme olasılığının bir tablosu. cumhurbaşkanlığı adaylığına başladığından beri Twitter’da adıyla hakarete uğradı).
Bay Comey ve Bay McCabe ile birlikte kimin kırmızı bilye olarak kabul edileceğinin seçimi ile olasılık büyük ölçüde artar.
Mesele bir sayıya karar vermek değil, cevabımızı yönlendiren şeyin grup büyüklüğü seçimimiz olduğunu kabul etmektir. Bazı tahminler kesinlikle diğerlerinden daha iyi olsa da, birçok seçenek savunulabilir.
Ayrıntıları ele almak
Şimdi biraz daha gerçekçi bir şeyi daraltmaya çalışalım ve bu soruna ilişkin basit yorumumuzda göz ardı ettiğimiz bazı şeylere geri dönelim.
İlk olarak, iki adam aynı yıl için denetlenmedi. Kapsamımızı 2017’den 2019’a kadar olan üç yıllık süreyi kapsayacak şekilde genişleterek ortaya çıkan olasılıklarımız önemli ölçüde artıyor. Bu basittir: Bir kişinin belirli bir yılda denetlenme şansı varsa, daha fazla yıl denetlenmek için daha fazla fırsat anlamına gelir.
İkincisi, yalnızca en az iki kişinin seçilmiş olma olasılığıyla ilgileniyoruz. . Aynı kişinin iki kez seçilme olasılığını dikkate almayacağız; Bay Comey’nin açıklamasına göre, denetimlerin bir yıla kadar uzayabileceği düşünülürse, bu pek olası görünmüyor. Bir gruptan üç veya daha fazla kişinin seçilmesi de önemli olacağından, tam olarak iki değil, en az iki kişinin seçilme olasılığına baktığımızı unutmayın.
Son olarak, IRS insanları gerçekten rastgele bir şekilde seçmez. Bunun yerine, kurum, yüksek gelirliler de dahil olmak üzere bazı vergi mükelleflerini diğerlerinden daha sık seçme eğilimindedir. 2001 vergi yılı için, NRP örneği, gelirin yüzde 90’ı civarındaki insanlardan, kazançlardan bağımsız olarak seçilen getirilerin bekleneceği oranın yaklaşık 1,7 katı olan getirileri içeriyordu. Bu oran, en yüksek gelir sıralarına yükseldi, böylece geliri en üst yüzde 0,5’te olan kişilerin, medyan gelire daha yakın birine göre örneklemde olma olasılığı 10 kat daha fazlaydı.
Bay Trump’ın düşmanlarından oluşan herhangi bir grubun, rastgele bir Amerikalı örneğinden daha fazlasını kazanacağını varsayabiliriz. Ancak grubumuzdaki herkesin her yıl tam gelirini gerçekçi bir şekilde tahmin edemeyiz. Ayrıca IRS’nin, vergi mükelleflerinin dosyaladığı beyannamelerin türü ve örnekleme yöntemlerinin yıldan yıla değişebileceği gibi örneklemesinde diğer faktörleri de dikkate aldığını biliyoruz. Bu, IRS’nin yöntemlerini nasıl eşleştireceğimize dair rehberlik yolunda çok az şey bırakıyor. Bu nedenle, tahminlerimizi gelire göre ağırlıksız bırakacağız. Zarfın arkası alıştırması olarak, gelirin bu sonuçları nasıl etkileyeceği konusunda endişeleniyorsanız, bir grubun üyelerinin çok yüksek kazançları olduğunu düşünüyorsanız, ortaya çıkan olasılığı ikiye katlayabilir ve eğer düşündüklerini düşünüyorsanız 10 ile çarpabilirsiniz. olağanüstü zenginiz.
Hepsini bir araya getirmek
Bu seçenekleri içeren aşağıdaki tablo, dikkate alınan grup büyüklüğüne bağlı olarak bazı tahmini olasılıklar sunmaktadır. .
Alternatif olarak, seçimlerimiz tatmin edici değilse, kendi olasılıklarınızı oluşturmanız için basit bir hesap makinesi oluşturduk:
Peki hangi tahmin “doğru”?
Bu denklemin en gerçekçi çıktıları, doğru bir şekilde “çok nadir” veya hatta “olağanüstü derecede nadir” olarak tanımlanabilir, ancak hiçbiri yanlış yapıldığının kanıtı değildir.
Columbia Üniversitesi’nde istatistik ve siyaset bilimi profesörü olan Andrew Gelman, bu alıştırma hakkında özet olarak kendisine söylendiğinde, “Biraz karşı konulmaz güç ve taşınmaz nesne gibi” dedi. “Bir yandan bunun tamamen rastgele olduğunu söylüyorsunuz. Öte yandan, öyle olmadığından şüpheleniyorsun.”
The Times’a bu sorun hakkında konuşan diğer tüm istatistikçiler gibi Bay Gelman da en büyük engelin ayrıntılar değil, sorunun kendisini tanımlamak olduğunu söyledi.
Belirli bir olayın olasılığını hesaplamaya çalıştığımızda çünkürastgele olmayabileceğinden şüpheleniriz, olayın olasılığını nasıl tahmin edeceğimizi hayal etmeye çalışmak gibi karmaşık bir duruma düşeriz. önceki oldu, dedi David Spiegelhalter. Kendisi, toplumda nicel kanıtların kullanılma şeklini iyileştirmeye adanmış bir kuruluş olan Cambridge Üniversitesi’ndeki Winton Risk ve Kanıt İletişimi Merkezi’nin başkanıdır.
Matematiğin kolay olduğunu söyledi, ancak soruyu formüle etmek zor, büyük ölçüde üzerinde çalıştığımız grubu saptamanın ne kadar zor olduğu için “anlamsız” ile sınırlanıyor.
“’Bunun olma ihtimali nedir?’ Yapılması kolay bir açıklama” dedi. “Yapması tanıdık bir açıklama. Ama aslında cevaplaması çok zor bir soru.”
Matematiğin sınırları vardır. Bunun gibi bir olasılığı tahmin etmeye çalışmanın amacı, dedi Bay Gelman, sayılara çok fazla stok koymak değil, sonucun sizi daha fazlasını öğrenmeye itmesine izin vermektir.
Bu durumda, en iyi soru, bir istatistik ders kitabında arayabileceğiniz cevabı olan soru değildir.
Bunun yerine Bay Gelman, sorulacak sorunun “Neler oluyor?” olduğunu söyledi.
Matthew Cullen raporlamaya katkıda bulundu.