ممیزی های کومی و مک کیب: چقدر احتمال دارد که آنها تصادفی بوده باشند؟

نیویورک تایمز گزارش داده است که سرویس درآمد داخلی یکی از دقیق ترین انواع حسابرسی های خود را به جیمز بی کومی، مدیر سابق اف بی آی، و اندرو جی. مک کیب، نماینده سابق او داده است.

این سؤالات کاملاً منطقی زیادی را برانگیخته است، که اکثر آنها انواعی از این موارد را دارند: شانس چیست؟ همانطور که مقاله اشاره کرد، احتمال اینکه دو دشمن سیاسی بلندپایه رئیس جمهور دونالد جی. ترامپ به طور تصادفی حسابرسی شوند بسیار ناچیز است.

اما کوچک صفر نیست.

اگر بخواهیم باور کنیم که این یک تصادف است، چقدر غیر محتمل است؟ در اینجا، ما سعی می کنیم تا آنجا که می توانیم این احتمال را به طور جدی تخمین بزنیم.

اول، حقایق: هر دو مرد برای ممیزی تحت برنامه تحقیقات ملی (NRP)، زیرمجموعه کوچکی از همه ممیزی هایی که IRS هر سال انجام می دهد، انتخاب شدند. این ممیزی‌ها نمونه‌ای از اظهارنامه‌ها را برای جمع‌آوری داده‌های مربوط به رعایت مالیات بررسی می‌کنند.

طبق گزارش IRS، حدود 5000 ممیزی از این دست در سال 2017، 4000 مورد در سال 2018 و 8000 مورد در سال 2019 وجود داشته است که از بین حدود 154 میلیون اظهارنامه مالیاتی فردی در هر سال انتخاب شده اند. آقای. حسابرسی کومی برای اظهارنامه مالیاتی 2017 او بود. آقای. مک کیب برای بازگشت او در سال 2019 بود.

بسیاری از جنبه های NRP محاسبات ما را پیچیده می کند، از جمله روش نمونه گیری حسابرسان IRS و سال های مختلف خود ممیزی ها. بعداً به این مسائل باز خواهیم گشت. در حال حاضر، ما فرض می کنیم که همه مالیات دهندگان شانس برابری برای حسابرسی دارند و هر دو مرد در سال 2017 حسابرسی شده اند.

اگر این مشکل در یک کتاب درسی در مورد احتمال ظاهر شود، ممکن است به صورت زیر خوانده شود:

اگر 154 میلیون تیله (تعداد تقریبی اظهارنامه های مالیاتی که در هر سال ارائه می شود) در یک کوزه غول پیکر وجود داشته باشد و تعداد کمی از آنها قرمز باشد (کسانی که نماینده آقای کومی و آقای مک کیب در میان آنها هستند)، چه شانسی دارید که شما آیا اگر به طور تصادفی چند هزار تیله قرمز را از کوزه بکشید (تعداد ممیزی در آن سال) دو یا چند تیله قرمز خواهید کشید؟

ممکن است پیچیده به نظر برسد، اما یک مسئله نسبتاً مطالعه شده است، چیزی که بسیاری از رشته های ریاضی یا آمار در دوره های دانشگاهی خود با آن مواجه می شوند. مردم قبلاً معادلاتی را برای تخمین این احتمالات با نام هایی مانند توزیع فوق هندسی که کاربردهایی مانند حسابرسی انتخابات و شمارش کارت دارد، استخراج کرده اند.

ما به سادگی می توانیم تخمین های خود را برای تعداد کل تیله ها، تعداد تیله های قرمز و تعداد قرعه کشی ها وارد کنیم و یک احتمال به دست می آوریم. اگر باور داشته باشیم که فقط دو تیله قرمز وجود دارد – یعنی اگر تمرین را به محدود کنیم فقط آقای. مک کیب و آقای کومی – این معادله احتمال تقریباً یک در 950 میلیون را به دست می دهد.

این شانس به طور قابل توجهی تندتر از شانس شما برای برنده شدن پاوربال است. همچنین یک نتیجه تقریباً بی معنی است. در بهترین حالت، این پاسخ درست به سوال اشتباه است.

برای درک اینکه چرا مستلزم اذعان به یک پوچی ذاتی در تمرین ما است: برای تخمین بهتر احتمال وقوع یک رویداد غیرمحتمل، باید این واقعیت را کنار بگذاریم که می دانیم قبلاً اتفاق افتاده است. (احتمال این اتفاق 100 درصد است.)

جردن النبرگ، استاد دانشگاه ویسکانسین که کتاب هایی در مورد ریاضیات و استدلال نوشته است، آن را اینگونه توصیف کرد: “در برخی از جهان های خلاف واقع، احتمال اینکه این چیزی که قبلاً در جهان ما اتفاق افتاده است چقدر است؟”

ممکن است عجیب به نظر برسد، اما همین مسائل حتی در تمرین‌های احتمالاتی به همان ابتدایی‌تر کردن یک سکه مطرح می‌شوند.

اگر یک سکه را 20 بار ورق بزنید، دنباله خاص سر و دم شما فوق العاده نادر است، حدود یک در میلیون، اما این اتفاق افتاد. و مقداری دنباله ای از تلنگر همیشه اتفاق می افتد. این یک تصادف شگفت‌انگیز است، تنها در صورتی که این دنباله‌ای باشد که شما پیش از ورق زدن می‌خواهید انجام دهید.

به همین ترتیب، نادرست است که جستجوی خود را فقط به Mr. کومی و آقای. مک کیب، زیرا به احتمال زیاد اگر آن دو را یاد بگیریم، این احتمالات را بررسی خواهیم کرد دیگر به جای این دو نفر، دشمنان سیاسی قابل توجه یک دولت حسابرسی شدند.

سوال بهتر این است: احتمال دو یا چند نفر چقدر است پسندیدن آقای. کومی و آقای. مک کیب در این مدت حسابرسی می شود؟

آیا این گروه از افراد باید شامل هر دو مقام ارشد FBI باشد؟ آیا دو مقام ارشد وزارت دادگستری وجود دارد؟ این چارچوب بندی – یک تصمیم ذهنی به جای یک تصمیم واقعی – است که بیشتر هر گونه تخمین احتمالی را هدایت می کند، بیش از هر انتخاب توزیع آماری یا وزن نمونه.

در اینجا نموداری از احتمالی است که معادله ما در انتخاب‌های مختلف برای تعداد تیله‌های قرمز به دست می‌آورد، از دو (آقای کومی و آقای مک کیب و هیچ‌کس دیگر) تا 400 (تخمین محافظه‌کارانه از تعداد آمریکایی‌های آقای ترامپ). از زمان شروع نامزدی خود برای ریاست جمهوری، در توییتر به نام توهین شده است).

این احتمال با انتخاب اینکه چه کسی باید در کنار Mr. کومی و آقای. مک کیب

نکته تصمیم گیری در مورد یک عدد نیست، بلکه درک این موضوع است که انتخاب اندازه گروه ما چیزی است که پاسخ ما را هدایت می کند. اگرچه برخی حدس ها مطمئناً بهتر از سایرین هستند، بسیاری از انتخاب ها قابل دفاع هستند.

اکنون بیایید سعی کنیم چیزی را تا حدی واقع بینانه تر محدود کنیم و به برخی از مواردی که در تفسیر ساده خود از این مشکل نادیده گرفته ایم بازگردیم.

اول اینکه این دو مرد در همان سال حسابرسی نشدند. با گسترش دامنه ما برای پوشش بازه سه ساله از 2017 تا 2019، احتمالات ما به طور قابل توجهی افزایش می یابد. این ساده است: اگر فردی شانس خاصی برای حسابرسی شدن در یک سال معین داشته باشد، سال های بیشتر به معنای فرصت های بیشتری برای حسابرسی شدن است.

دوم، ما فقط به احتمال انتخاب حداقل دو نفر علاقه مندیم. ما این احتمال را در نظر نخواهیم گرفت که یک شخص دو بار انتخاب شود. به گفته آقای بعید به نظر می رسد که ممیزی ها بیش از یک سال طول بکشد. حساب کومی توجه داشته باشید که ما به احتمال انتخاب حداقل دو نفر نگاه می کنیم، نه دقیقاً دو نفر، زیرا اگر سه یا چند نفر از یک گروه انتخاب شوند نیز بسیار مهم است.

در نهایت، IRS افراد را واقعاً تصادفی انتخاب نمی کند. در عوض، آژانس تمایل دارد برخی از انواع مالیات دهندگان، از جمله افراد با درآمد بالا را بیشتر از سایرین انتخاب کند. برای سال مالیاتی 2001، نمونه NRP شامل بازده افرادی در حدود صدک 90 درآمد با حدود 1.7 برابر نرخی بود که انتظار می رفت در صورتی که بازدهی مستقل از درآمد تعیین شود. این نرخ در بالاترین رتبه‌های درآمدی افزایش یافت، به طوری که احتمال حضور افراد با درآمد در 0.5 درصد بالا، بیش از 10 برابر بیشتر از افراد نزدیک به درآمد متوسط ​​در نمونه بود.

احتمالاً می توانیم فرض کنیم که هر گروهی از آقای. درآمد دشمنان ترامپ بیشتر از یک نمونه تصادفی آمریکایی است. اما ما نمی توانیم به طور واقع بینانه درآمد کامل همه افراد گروه خود را در هر سال تخمین بزنیم. همچنین می دانیم که سازمان امور مالیاتی عوامل دیگری را در نمونه گیری خود در نظر گرفته است، مانند نوع اظهارنامه هایی که مالیات دهندگان ارائه می کنند و روش های نمونه گیری می تواند سال به سال تغییر کند. این امر ما را در راه راهنمایی برای نحوه مطابقت با روش های IRS باقی می گذارد. به این ترتیب، ما برآوردهای خود را بدون وزن می‌گذاریم. به عنوان یک تمرین پشت پاکت، اگر نگران این هستید که چگونه درآمد بر این نتایج تأثیر می‌گذارد، اگر فکر می‌کنید که اعضای یک گروه درآمد بسیار بالایی دارند، می‌توانید احتمال حاصل را دو برابر کنید و اگر فکر می‌کنید آن‌ها را در 10 ضرب کنید. فوق العاده ثروتمند هستند

با ترکیب این گزینه ها، جدول زیر برخی از احتمالات تخمین زده شده را بسته به اندازه گروه در نظر گرفته ارائه می دهد.

از طرف دیگر، اگر انتخاب های ما رضایت بخش نبود، ما یک ماشین حساب ساده برای شما ایجاد کردیم تا احتمالات خود را بسازید:

بنابراین کدام تخمین “درست” است؟

اکثر خروجی های واقع بینانه این معادله را می توان با دقت به عنوان “بسیار نادر” یا حتی “فوق العاده نادر” توصیف کرد، اما هیچ کدام دلیلی بر انجام اشتباه نیست.

اندرو گلمن، استاد آمار و علوم سیاسی در دانشگاه کلمبیا، هنگامی که به صورت خلاصه در مورد این تمرین گفته شد، گفت: «این کمی شبیه نیروی مقاومت ناپذیر و جسم غیرقابل حرکت است. از یک طرف، شما می گویید این کاملا تصادفی است. از طرف دیگر، شما مشکوک هستید که اینطور نیست.»

آقای. گلمن، مانند هر آماردان دیگری که با تایمز در مورد این مشکل صحبت کرد، گفت که بزرگترین مانع هیچ یک از جزئیات نیست، بلکه تعریف خود سوال است.

زمانی که سعی می کنیم احتمال یک رویداد معین را محاسبه کنیم زیرا ما گمان می کنیم که ممکن است تصادفی نباشد، در نهایت در موقعیت پیچیده ای قرار می گیریم که سعی می کنیم تصور کنیم که چگونه احتمال وقوع رویداد را پیش بینی می کردیم. قبل از دیوید اشپیگلهالتر گفت که این اتفاق افتاد. او رئیس مرکز ارتباط ریسک و شواهد وینتون در دانشگاه کمبریج است، سازمانی که به بهبود روش استفاده از شواهد کمی در جامعه اختصاص دارد.

او گفت که ریاضیات آسان است، اما فرمول‌بندی این سؤال دشوار است و در حد “بی معنی” است، تا حد زیادی به این دلیل که تعیین گروهی که به آن اهمیت می‌دهیم سخت است.

“” شانس این اتفاق چقدر است؟ بیانیه ای آسان است.» “این یک بیانیه آشنا است. اما، در واقع، پاسخ به این سوال بسیار دشوار است.»

ریاضی محدودیت هایی دارد. نکته تلاش برای تخمین احتمالی مانند این، آقای. گلمن گفت، این نیست که مقدار زیادی در اعداد قرار دهید، بلکه اجازه دهید نتیجه شما را وادار کند تا بیشتر بدانید.

در این مورد، بهترین سوال، سوالی نیست که بتوان آن را در کتاب آمار جستجو کرد.

در عوض، آقای گلمن گفت، سوالی که باید مطرح کرد این است: “چه خبر است؟”


متیو کالن گزارش کمک کرد


تمامی اخبار به صورت تصادفی و رندومایز شده پس از بازنویسی رباتیک در این سایت منتشر شده و هیچ مسئولتی در قبال صحت آنها نداریم