6.5: Як брехати зі статистикою

Last updated

Oct 27, 2022
Save as PDF
- 6.4: Основні статистичні поняття та методи
- Назад Матерія

$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$

$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$

$\newcommand{\id}{\mathrm{id}}$

$\newcommand{\Span}{\mathrm{span}}$

$\newcommand{\kernel}{\mathrm{null}\,}$

$\newcommand{\range}{\mathrm{range}\,}$

$\newcommand{\RealPart}{\mathrm{Re}}$

$\newcommand{\ImaginaryPart}{\mathrm{Im}}$

$\newcommand{\Argument}{\mathrm{Arg}}$

$\newcommand{\norm}[1]{\| #1 \|}$

$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$

$\newcommand{\Span}{\mathrm{span}}$

$\newcommand{\id}{\mathrm{id}}$

$\newcommand{\Span}{\mathrm{span}}$

$\newcommand{\kernel}{\mathrm{null}\,}$

$\newcommand{\range}{\mathrm{range}\,}$

$\newcommand{\RealPart}{\mathrm{Re}}$

$\newcommand{\ImaginaryPart}{\mathrm{Im}}$

$\newcommand{\Argument}{\mathrm{Arg}}$

$\newcommand{\norm}[1]{\| #1 \|}$

$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$

$\newcommand{\Span}{\mathrm{span}}$

(Назва цього розділу, багато тем, які він обговорює, і навіть деякі приклади, які він використовує, взяті з Huff 1954.)

Основне обґрунтування фундаментальних статистичних понять і прийомів, наведених в останньому розділі, дає нам можливість розуміти та аналізувати статистичні аргументи. Оскільки реальні приклади таких аргументів настільки часто маніпулятивні та вводять в оману, наша мета в цьому розділі полягає в тому, щоб спиратися на фундамент останнього, вивчаючи деякі найпоширеніші статистичні помилки - погані аргументи та оманливі методи, які використовуються для спроби бамбузувати нас цифрами.

Вражаючі цифри без контексту

Я розглядаю можливість покупки шампуню нової марки. Той, на який я дивлюся, обіцяє «на 85% більше тіла». Це звучить чудово для мене (я досить лисий; Я можу використовувати все зайве тіло, яке я можу отримати). Але перш ніж я зроблю покупку, можливо, мені слід врахувати той факт, що пляшка шампуню не відповідає на це просте наступне запитання: на 85% більше тіла, ніж що? У пляшці згадується, що склад всередині «новий і вдосконалений». Так може бути, це на 85% більше тіла, ніж у неполіпшеного шампуню? Або, можливо, вони означають, що їх шампунь дає волоссю на 85% більше тіла, ніж їх конкурентів. Який же конкурент? Той, який найкраще робить, надаючи волоссю більше тіла? Той, що робить найгірше? Середній з усіх конкуруючих брендів? Або, можливо, це на 85% більше тіла, ніж щось інше цілком. У мене колись був вчитель середньої школи, який порадив мені масажувати шкіру голови протягом 10 хвилин щодня, щоб запобігти облисінню (я не прийняв пропозицію; можливо, мені слід було б). Можливо, цей шампунь виробляє на 85% більше тіла, ніж щодня 10-хвилинні масажі. Або, можливо, це на 85% більше тіла, ніж ніколи не мити волосся взагалі. І тільки що таке «тіло» все одно? Як його кількісно оцінюють і вимірюють? Чи брали високоточні штангенциркулі і систематично вимірювали ширину волосків? Або це більше функція покриття - волосся на квадратний дюйм поверхні шкіри голови?

Сумним фактом є те, що відповідей на ці питання не прийде. Твердження, що шампунь дасть моєму волоссю на 85% більше тіла, звучить вражаюче, але без додаткової інформації для мене, щоб контекстуалізувати це твердження, я поняття не маю, що це означає. Це класичний риторичний прийом: викиньте велику кількість, щоб справити враження на свою аудиторію, не надаючи контексту, необхідного для того, щоб оцінити, чи дійсно ваша претензія настільки вражаюча. Зазвичай, при найближчому розгляді, цього не є.Рекламодавці і політики весь час використовують цю техніку.

Навесні 2009 року економіка була в дуже поганій формі (наслідки фінансової кризи, яка почалася восени року раніше, все ще відчувалися; індекси фондового ринку не досягли свого дна до березня 2009 року, а рівень безробіття все ще зростав). Барак Обама, нещодавно інавгураційний президент в той час, хотів надіслати повідомлення американському народу, що він його отримав: домогосподарства скорочували свої витрати через рецесію, і тому уряд зробить те саме. (Звучить добре, але це погана макроекономіка. Більшість економістів сходяться на думці, що під час такого спаду уряд повинен брати в борг і витрачати більше, а не менше, щоб стимулювати економіку. Президент знав це; він відкрив величезний законопроект про державні витрати через Конгрес (Американський закон про реінвестування та відновлення) пізніше того ж року.) Після першої зустрічі зі своїм кабінетом (секретарями оборони, держави, енергетики тощо) він провів прес-конференцію, на якій оголосив, що наказав кожному з них скоротити 100 мільйонів доларів з бюджетів своїх відомств. Він мав чудову лінію, щоб піти з оголошенням: «100 мільйонів доларів там, 100 мільйонів доларів тут - досить скоро, навіть тут, у Вашингтоні, це додає реальні гроші». Смішні. І вражаюче звучання. 100 мільйонів доларів - це пекло багато грошей! Принаймні, це пекельно багато грошей для мене. Я отримав - дайте мені секунду, поки я перевіряю - $64 в моєму гаманці прямо зараз. Хотілося б, щоб у мене було 100 мільйонів доларів. Але, звичайно, мої особисті фінанси - це неправильний контекст, в якому оцінювати оголошення президента. Він говорить про скорочення з федерального бюджету; це контекст. Наскільки це велике? У 2009 році це було трохи більше 3 трильйонів доларів. Є п'ятнадцять відділів, які контролюють члени кабінету міністрів. Тоді скорочення, замовлене Обамою, склало 1,5 мільярда доларів. Це 0,05% федерального бюджету. Це число не звучить настільки вражаюче зараз, коли ми ставимо його у належному контексті.

2009 рік наводить ще один приклад цієї методики. Противники Закону про доступну допомогу («Obamacare») скаржилися на тривалість законопроекту: вони повторювали знову і знову, що це було 1000 сторінок завдовжки. Ця скарга добре поєднується з їх характеристикою закону як boondoggle і урядовим захопленням системи охорони здоров'я. 1,000 сторінок, звичайно, звучить як багато сторінок. Ця книга входить під 250 сторінок; уявіть, якби це було 1000! Це було б там із горезвісно довгими книгами, такими як «Війна і мир», «Нещасний» та «Нескінченний жарт». Це довго для книги, але чи багато сторінок для частини федерального законодавства? Ну, він великий, але точно не безпрецедентний. Той рік законопроект про стимулювання був приблизно такої ж довжини. Бюджетний законопроект президента Буша на 2007 рік просто соромився 1500 сторінок. (Це корисний ресурс: http://www.slate.com/articles/news_a...er_weight.html) Його немає дитини, що залишився позаду рахунків годинник в просто сором'язливий 700. Справа в тому, що основні законодавчі акти мають багато сторінок. Закон про доступну допомогу не був особливо незвичайним.

Помилка нерозуміння

Як ми вже обговорювали, вбудована в логіку вибірки є похибкою. Це вірно для вимірювання, як правило, що випадкова похибка неминуча: незалежно від того, вимірюєте ви довжину, вагу, швидкість чи щось інше, існують притаманні межі точності та точності, з якими наші прилади можуть вимірювати речі. Похибки вимірювань вбудовані в логіку наукової практики загалом; вони повинні бути враховані. Невиконання цього - або навмисне ігнорування помилки - може призвести до оманливих повідомлень про висновки.

Це особливо зрозуміло у випадку з опитуваннями громадської думки. Як ми бачили, результати таких опитувань - це не точні відсотки, про які часто повідомляють, а скоріше діапазони можливих відсотків (при цьому ці діапазони надійні лише на рівні довіри 95%, як правило). І тому повідомити про результати опитування, наприклад, як «29% американців вважають, що це снігова людина», є трохи оманливим, оскільки це залишає межі похибки та рівень довіри. Гірший гріх вчиняється (досить часто), коли проводяться порівняння між відсотками і пропущена похибка. Це характерно в політиці, коли вимірюються рівні підтримки двох претендентів на посаду. Типовий заголовок газети може повідомити щось на кшталт цього: «Трамп піднявся на лідерство над Клінтоном в останньому опитуванні, 44% до 43%». Це сексуальний заголовок: він, ймовірно, продаватиме папери (або, в даний час, генерувати кліки), як (щасливим) прихильникам Трампа, так і (стривоженим) прихильникам Клінтона. Але це вводить в оману: це говорить про рівень точності, остаточний результат, який дані просто не підтримують. Припустимо, що похибка для цього гіпотетичного опитування склала 3%. Результати опитування насправді говорять нам про те, що (на рівні 95% довіри) справжній рівень підтримки Трампа серед населення в цілому становить десь від 41% до 47%, тоді як справжній рівень підтримки Клінтон становить десь від 40% до 46%. Ці дані відповідають керівництву Трампа, щоб бути впевненим; але вони також дозволяють командувати 46% до 41% лідерства для Клінтон. Найкраще, що ми можемо сказати, це те, що трохи більше шансів, що справжній рівень підтримки Трампа вище, ніж у Клінтона (принаймні, ми впевнені; 95% інтервал довіри і все). Коли відмінності менші за похибку (насправді, вдвічі перевищує похибку при порівнянні двох чисел), вони просто не означають дуже багато. Це факт, який заголовки зазвичай ігнорують. Це дає читачам оманливе враження про те, з якою впевненістю можна дізнатися стан раси.

На початку навчання вчені дізнаються, що вони не можуть повідомляти про значення, менші за похибку, прикріплену до їх вимірювань. Якщо ви зважуєте якусь речовину, скажімо, а потім запустіть експеримент, в якому вона перетворюється на газ, ви можете підключити свої цифри до ідеального закону газу і ввести їх у свій калькулятор, але вам не дозволяється повідомляти про всі цифри, які з'являються після десяткового знака. Кількість так званих «значущих цифр» (або іноді «цифр»), які ви можете використовувати, обмежується розміром похибки в ваших вимірах. Якщо ви можете знати початкову вагу лише в межах 0,001 грам, наприклад, тоді, незважаючи на те, що калькулятор випльовує .4237645, ви можете повідомити про результат лише за допомогою трьох значущих цифр - .424 після округлення.

Чим більше значущих цифр ви повідомляєте, тим точніше ви маєте на увазі ваше вимірювання. Це може мати риторичний ефект полегшення переконування вашої аудиторії. Точні цифри вражають; вони створюють враження, що ви дійсно знаєте, про що говорите, що ви зробили серйозну кількісну аналітичну роботу. Припустимо, я запитую 1000 студентів коледжу, скільки сну вони отримали минулої ночі. (Цей приклад натхненний Хаффом 1954 р., с. 106 - 107.) Я складаю всі цифри і ділю на 1000, і мій калькулятор дає мені 7.037 годин. Якби я ходив, розповідаючи людям, що я зробив дослідження, яке показало, що середній студент коледжу отримує 7.037 годин сну за ніч, вони були б дуже вражені: мої методи дослідження були настільки ретельними, що я можу повідомити про час сну до тисячних часток години. Вони, мабуть, отримали уявну картину моєї лабораторії, з складним обладнанням, підключеним до студентів коледжу на ліжках, вимірюючи такі речі, як швидкий рух очей та моделі дихання, щоб визначити точні моменти, коли сон починається і закінчується. Але у мене такої лабораторії немає. Я просто запитав купу людей. Запитайте себе: скільки ви спали минулої ночі? У мене вийшло близько 9 годин (це вихідні). Ключове слово в цьому реченні - «про». Чи могло це бути трохи більше або менше 9 годин? Чи могло бути 9 годин 15 хвилин? 8 годин 45 хвилин? Звичайно. Помилка в повідомленні будь-якої людини про те, скільки вони спали минулої ночі, обов'язково буде чимось на зразок чверті години. Це означає, що я не маю права на ті 37 тисячних часток години, що я повідомив з мого маленького опитування. Найкраще, що я можу зробити, це сказати, що середній студент коледжу отримує близько 7 годин сну на ніч, плюс або мінус 15 хвилин або близько того. 7.037 є точним, але точність цієї цифри є помилковою (не справжньою, помилковою).

Ігнорування помилки, пов'язаної з вимірюваннями, може мати глибокі наслідки в реальному житті. Розглянемо президентські вибори в США 2000 року. Джордж Буш-молодший переміг в тому році Ела Гора, і все це дійшло до штату Флорида, де остаточний запас перемоги (після того, як були розпочаті перерахунки, то зупинені, потім знову почалися, потім остаточно зупинилися за наказом Верховного суду США) склав 327 голосів. Того року у Флориді було подано близько 6 мільйонів голосів. Маржа 327 становить близько 0,005% від загальної суми. Ось в чому справа: підрахунок голосів - це вимір, як і будь-який інший; до нього додається помилка. Ви, можливо, пам'ятаєте, що в багатьох округах Флориди вони використовували бюлетені з перфорацією картки, де виборці вказують свої переваги, пробиваючи отвір через перфороване коло в папері поруч з ім'ям свого кандидата. Іноді круговий аркуш паперу - так званий «чад» - не повністю від'єднується від бюлетеня, і коли цей бюлетень проходить через машину для підрахунку голосів, чад закінчується закриттям отвору і помилково реєструється неголосування. Інші типи методів підрахунку голосів - навіть підрахунок рук (Це може бути до 2% для підрахунку рук! Дивіться тут: https://www.sciencedaily.com/release...0202151713.htm) —мають власну помилку. І який би метод не використовувався, помилка буде більшою за 0,005% маржі, яка вирішила вибори. Як сказав один видатний математик: «Ми вимірюємо бактерії за допомогою міри». (Джон Паулос, «Ми вимірюємо бактерії за допомогою міри», 22 листопада 2000 року, Нью-Йорк Таймс.) Тобто інструмент, який ми використовуємо (підрахунок, машиною або вручну) занадто сирий, щоб виміряти розмір речі, яку ми зацікавлені (різниця між Бушем і Гором). Він запропонував їм перевернути монету, щоб вирішити Флориду. Просто неможливо знати, хто виграв ці вибори.

У 2011 році новообраний губернатор Вісконсіна Скотт Уокер разом зі своїми союзниками в законодавчому органі штату прийняв законопроект про бюджет, який мав ефект, серед іншого, скорочення оплати праці працівників державного сектору на досить значну суму. Було багато шуму; можливо, ви бачили протести в новині. Люди, які були проти законопроекту, висловлювали свою справу різними способами. Однією з ліній нападу була економічна: позбавлення такої кількості жителів Вісконсіна стільки грошей завдасть шкоди економіці штату та спричинить втрати робочих місць (державні працівники витрачали б менше, що зашкодило б підсумкам місцевого бізнесу, що призведе до того, що вони звільнять своїх працівників). Одна газетна історія того часу цитувала професора економіки, який стверджував, що законопроект губернатора коштуватиме державі 21 843 робочих місць. (Стівен Вербург, «Дослідження: бюджет може зашкодити економіці штату», 20 березня 2011 р., Вісконсін Державний журнал.) Не 21 844 робочих місць; це не так вже й погано. Всього 21 843. Це число звучить вражаюче; це дуже точно. Але, звичайно, що точність є помилковою. Оцінка економічних наслідків державної політики є надзвичайно невизначеною справою. Я не знаю, яку модель використовував цей економіст, щоб скласти свою оцінку, але як би там не було, неможливо, щоб її результати були достатньо достовірними, щоб повідомити про те, що багато значущих цифр. Я припускаю, що в кращому випадку 2 в 21,843 має будь-яке значення взагалі.

Складні відсотки

Статистичні аргументи сповнені відсотків, і є багато способів обдурити людей з ними. Ключ до того, щоб не бути обдуреним такими цифрами, як правило, полягає в тому, щоб мати на увазі, що це відсоток. Невідповідні, зрушення або стратегічно підібрані числа можуть дати вам оманливі відсотки.

Коли числа дуже малі, використання відсотків замість дробів вводить в оману. Медична школа Джона Хопкінса, коли вона відкрилася в 1893 році, була однією з небагатьох медичних шкіл, які дозволяли жінкам вступати в школу. (Не тому, що адміністрація школи була особливо освічена. Вони могли відкритися лише за фінансової підтримки чотирьох заможних жінок, які зробили це умовою для своїх пожертвувань.) У ті часи benighted люди стурбовані жінками, які вступають до шкіл з чоловіками з різних дурних причин. Одним з них був страх, що вразливі панянки закохаються в своїх професорів і вийдуть за них заміж. Абсурд, правда? Ну, можливо, ні: у першому класі, щоб записатися до школи, 33% жінок дійсно одружилися зі своїми професорами! Сексисти, мабуть, мали рацію. Ця цифра звучить вражаюче, поки ви не дізнаєтеся, що знаменник 3. Три жінки вступили до Джона Хопкінса того першого року, і одна з них вийшла заміж за свого професора анатомії. Використання відсотка, а не дробу, перебільшує в оману. Ще один складений приклад: я живу у відносно безпечному маленькому містечку. Якби я побачив заголовок у своїй місцевій газеті, в якому говорилося: «Збройні пограбування зросли на 100% за минулий рік», я був би дуже стривожений. Тобто, поки я не зрозумів, що минулого року в місті було одне озброєне пограбування, а цього року їх було два. Тобто 100% збільшення, але використання відсотка такого невеликого числа вводить в оману.

Ви можете обдурити людей, змінивши число, яке ви берете відсоток від середнього потоку. Припустимо, ви співробітник моєї вищезгаданої LogiCorp. Ви оцінюєте аргументи за $10.00 на годину. Одного разу я закликаю всіх своїх співробітників на зустріч. Я оголошую, що економіка повернулася в гіршу сторону, і у нас менше аргументів, що надходять на оцінку; бізнес сповільнюється. Я не хочу нікого звільняти, тому пропоную нам усім розділити біль: я скорочу зарплату всім на 20%; але коли економіка повернеться, я вирішу це вам. Таким чином, ви погоджуєтеся йти разом з цим планом, і ви страждаєте через рік, роблячи лише $8.00 на годину оцінки аргументів. Але коли рік закінчується, я закликаю всіх разом і оголошую, що все покращується, і я готовий все правильно: починаючи з сьогоднішнього дня, всі отримують 20% підвищення. Спочатку 20% скоротити, тепер 20% підвищення; ми повернулися туди, де ми були, чи не так? Неправильно. Я змінив цифри середині потоку. Коли я спочатку скоротив вашу зарплату, я взяв двадцять відсотків від $10.00, що є зменшенням $2.00. Коли я дав вам підвищення, я дав вам двадцять відсотків вашої зниженої ставки оплати праці 8,00 доларів на годину. Це лише $1.60. Ваша остаточна ставка оплати становить лише $9.60 на годину. (Цей приклад натхненний Хаффом 1954 р., с. 110 - 111.)

Часто люди приймають стратегічне рішення про те, з якого числа брати відсоток, вибираючи той, який надає їм більш вражаюче звучить, риторично ефективну фігуру. Припустимо, я, як генеральний директор LogiCorp, поставив перед компанією амбітну мету протягом наступного року: пропоную збільшити нашу продуктивність з 800 аргументів, оцінених на день, до 1000 аргументів на день. Наприкінці року ми оцінюємо 900 аргументів на день. Ми не досягли своєї мети, але зробили поліпшення. У своєму річному звіті інвесторам я проголошую, що ми були успішними на 90%. Це звучить добре; 90% дійсно близькі до 100%. Але це вводить в оману. Я вирішив взяти відсоток 1000:900 розділений на 1000 дає нам 90%. Але чи є це відповідним способом виміряти ступінь, в якій ми досягли мети? Я хотів збільшити наше виробництво з 800 до 1000; тобто я хотів загальне збільшення 200 аргументів на день. Скільки збільшення ми насправді отримали? Ми пішли від 800 до 900; це збільшення на 100. Наша мета була 200, але ми отримали тільки до 100. Іншими словами, ми досягли лише 50% своєї мети. Це звучить не так добре.

Ще один випадок стратегічного вибору. Противники прав на аборти можуть зазначити, що 97% гінекологів у Сполучених Штатах мали пацієнтів шукати аборти. Це створює враження, що існує епідемія пошуку абортів, що це відбувається регулярно. Хтось із іншого боку дебатів може зазначити, що лише 1,25% жінок дітородного віку щороку роблять аборт. Навряд чи це епідемія. Кожен з учасників цієї дискусії вибрав зручне число, щоб взяти відсоток. Для активіста проти абортів, це кількість гінекологів. Це правда, що 97% мають пацієнтів, які шукають аборти; хоча лише 14% з них фактично виконують процедуру. На 97% перебільшує поширеність абортів (для досягнення риторичного ефекту). Для активіста «за вибір» зручно брати відсоток від загальної кількості жінок дітородного віку. Це правда, що крихітна частина з них робить аборти в даний рік; але ми повинні мати на увазі, що лише невеликий відсоток цих жінок вагітні в даний рік. Власне кажучи, серед тих, хто насправді завагітніє, щось на кшталт 17% роблять аборт. 1,25% мінімізує поширеність абортів (знову ж таки, для досягнення риторичного ефекту).

Помилка базової ставки

Базова швидкість - це частота, з якою відбувається якась подія, або спостерігається якесь явище. Коли ми ігноруємо цю інформацію або забуваємо про неї, ми робимо помилку і робимо помилки в міркуваннях.

Більшість автомобільних аварій трапляються серед білого дня, на низьких швидкостях та поблизу будинку. Тож чи означає це, що я безпечніший, якщо я їду дуже швидко, вночі, під дощем, далеко від свого будинку? Звичайно, ні. Тоді чому в колишніх умовах трапляється більше нещасних випадків? Базові тарифи: набагато більше нашого часу на водіння витрачається на низьких швидкостях, вдень і близько до дому; відносно мало його витрачається на швидку їзду вночі, під дощем і далеко від дому. (Цей приклад натхненний Хаффом 1954 р., с. 77 - 79.)

Розглянемо жінку, раніше відому як Мері (вона змінила ім'я на Moon Flower). Вона є відданим пацифістом, веганом та екологом; вона добровольцем із Green Peace; її улюблена вправа - йога. Що більш імовірно: що вона є автором бестселерів нью-ейдж, альтернативної медицини, книг про самодопомогу - або що вона офіціантка? Якщо ви відповіли, що вона, швидше за все, стане автором бестселерів книг про самодопомогу, ви стали жертвою помилки базової ставки. Звичайно, Moon Flower підходить під стереотип того роду людини, який був би автором таких книг ідеально. Тим не менш, набагато більш імовірно, що людина з цими характеристиками буде офіціанткою, ніж автором бестселерів. Чому? Базові ставки. Є далеко, далеко (далеко! ) більше офіціанток у світі, ніж авторів-бестселерів (книг нью-ейдж, альтернативної медицини, самодопомоги). Базова ставка офіціантки вище, ніж у авторства бестселера на багато порядків.

Припустимо, що існує медичний скринінг-тест на серйозне захворювання, який є дуже точним: він виробляє лише помилкові спрацьовування 1% часу, і він виробляє лише помилкові негативні речовини 1% часу (він дуже чутливий і високоспецифічний). Захворювання серйозне, але рідкісне: воно зустрічається лише у 1 з кожних 100 000 чоловік. Припустимо, ви пройшли обстеження на цю хворобу, і ваш результат позитивний; тобто ви позначені як можливо, захворювання. Враховуючи те, що ми знаємо, яка ймовірність того, що ви насправді хворієте? Це не 99%, незважаючи на точність тесту. Це набагато нижче. І я можу це довести, використовуючи наш старий друг Закон Байєса. Ключем до розуміння того, чому ймовірність набагато нижча за 99%, як ми побачимо, є врахування базової норми захворювання.

Є дві гіпотези, які слід враховувати: що ви хворі (назвіть це 'S') і що ви не хворі (~ S). Доказом, який ми маємо, є позитивним результатом тесту (P). Ми хочемо знати ймовірність того, що ви хворі, враховуючи ці докази: P (S | P). Закон Байєса говорить нам, як це обчислити:

$\mathrm{P}(\mathrm{S} | \mathrm{P})=\frac{\mathrm{P}(\mathrm{S}) \times \mathrm{P(P|S)}}{\mathrm{P(S)} \times \mathrm{P}(\mathrm{P} | \mathrm{S})+\mathrm{P}(\sim \mathrm{S}) \times \mathrm{P}(\mathrm{P} | \sim \mathrm{S})}$

Базовий показник хвороби - це швидкість, з якою вона виникає у загальної популяції. Це рідко: це трапляється лише у 1 з 100 000 людей. Це число відповідає попередній ймовірності хвороби в нашій формулі—P (S). Ми повинні помножити в чисельнику на 1/100 000; це матиме ефект зниження ймовірності хвороби, навіть враховуючи позитивний результат тесту. А як щодо інших членів нашого рівняння? 'P (~ S) 'просто вибирає попередню ймовірність не хворіти; якщо P (S) = 1/100 000, то P (~ S) = 99,999/100 000. «P | S) '- це ймовірність того, що ви отримаєте позитивний результат тесту, припускаючи, що ви насправді хворі. Нам кажуть, що тест дуже точний: він говорить лише хворим людям, що вони здорові 1% часу (1% помилкових негативів); тому ймовірність того, що хвора людина отримає позитивний результат тесту, становить 99% —P (P | S) = .99. 'P (P | ~ S) '- це ймовірність того, що ви отримаєте позитивний результат, якщо не захворіли. Це показник помилкових спрацьовувань, який становить 1% — P (P | ~ S) = .01. Включивши ці числа в формулу, отримуємо результат, що P (S | P) = .000999. Це вірно, враховуючи позитивний результат цього дуже точного скринінгового тесту, ви ймовірність захворіти трохи менше 1/10,000. Тест точний, але захворювання настільки рідкісне (його базовий показник настільки низький), що ваші шанси захворіти все ще дуже низькі навіть після позитивного результату.

Іноді люди будуть ігнорувати базові ставки навмисно, щоб спробувати вас обдурити. Чи знали ви, що марихуана небезпечніше героїну? І я. Але подивіться на цю діаграму:

Знімок екрана 2019-10-10 в 11.43.04 PM.png

Ця графіка, опублікована в історії в USA Today під заголовком «Марихуана представляє більше ризиків, ніж багато хто усвідомлює». (Ліз Сабо, «Марихуана представляє більше ризиків, ніж багато хто розуміє,» Липень 27, 2014, США сьогодні. http://www.usatoday.com/story/news/n.../? sf29269095=1) Комбо діаграма/заголовка створює тривожне враження: якщо набагато більше людей їдуть до відділення невідкладної допомоги через марихуану, це повинно бути небезпечніше, ніж я зрозумів. Подивіться на це: більше ніж в два рази більше відвідувань відділення невідкладної допомоги для горщика, ніж героїн; це майже так само погано, як кокаїн! А може і ні. Ця діаграма ігнорує базові ставки вживання марихуани, кокаїну та героїну серед населення. Далеко (далеко!) більше людей вживають марихуану, ніж вживають героїн або кокаїн. Справжньою мірою відносної небезпеки різних препаратів буде кількість відвідувань невідкладної допомоги на користувача. Це дає вам набагато іншу діаграму (від німецького Лопеса, «Марихуана відправляє більше людей до ER, ніж героїн. Але це ще не вся історія». 2 серпня 2014 року, Vox.com. http://www.vox.com/2014/8/2/5960307/...roin-USA-Today):

Знімок екрана 2019-10-10 в 11.43.43 PM.png

Лежачи з картинками

Говорячи про діаграми, вони є ще одним інструментом, яким можна скористатися (зловживати) для складання сумнівних статистичних аргументів. Ми часто використовуємо діаграми та інші зображення, щоб графічно передати кількісну інформацію. Але ми повинні особливо подбати про те, щоб наші знімки точно відображали цю інформацію. Існують всілякі способи, за допомогою яких графічне подання даних може спотворити реальний стан справ і ввести в оману нашу аудиторію.

Розглянемо, ще раз, мою вигадану компанію LogiCorp. Бізнес вдосконалюється останнім часом, і я хочу отримати деяких зовнішніх інвесторів, щоб я міг рости ще швидше. Тому я вирішив піти на це телешоу Shark Tank. Ви знаєте, той, що з Марком Кубаном та панеллю інших багатих людей, де ви робите презентацію для них, і вони вирішують, чи варто інвестувати в вашу ідею. У будь-якому випадку, мені потрібно спланувати переконливу презентацію, щоб переконати одну з акул дати мені цілу купу грошей на LogiCorp. Я збираюся використовувати графік, щоб вразити їх потенціалом компанії для майбутнього зростання. Ось графік мого прибутку за останнє десятиліття:

Знімок екрана 2019-10-10 в 11.47.17 PM.png

Непогано. Але і не чудово. Позитивна тенденція прибутку добре видно, але було б непогано, якби я міг зробити так, щоб вона виглядала трохи драматичніше. Я просто трохи налаштую речі:

Знімок екрана 2019-10-10 в 11.47.24 PM.png

Краще. Все, що я зробив, це відрегулювати вісь y. Немає жодної причини, щоб пройти весь шлях до нуля і до 240. Зараз посилений нахил вгору; схоже, LogiCorp зростає швидше.
Але я думаю, що я можу зробити ще краще. Чому вісь х повинна бути такою довгою? Якби я стиснув графік горизонтально, моя крива нахилилася б ще більш різко:

Знімок екрана 2019-10-10 в 11.47.30 PM.png

Тепер це вибухове зростання! Акули будуть любити це. Ну, тобто до тих пір, поки вони не надто уважно дивляться на діаграму. Прибуток на порядку $1.80 на рік не збирається вразити такого мільярдера, як Марк Кубан. Але я можу це виправити:

Знімок екрана 2019-10-10 в 11.47.35 PM.png

Там. Для всіх цих акул знають, прибуток вимірюється мільйонами доларів. Звичайно, за всі мої маніпуляції вони все ще можуть бачити, що прибуток за десятиліття збільшився на 400%. Це, звичайно, досить добре, але, можливо, я можу залишити трохи місця для них, щоб подумки заповнити більш значні цифри:

Знімок екрана 2019-10-10 в 11.51.12 PM.png

Це один. Зростаючий прибуток, і, схоже, вони почали близько до нуля і піднялися до—ну, ми насправді не можемо сказати. Можливо, ці горизонтальні лінії піднімаються з кроком 100, або 1000. Прибуток Logicorp може бути неймовірно високим.

Люди весь час маніпулюють віссю y діаграм для риторичного ефекту. У своєму документі «Обіцянка Америці» 2010 року Республіканська партія пообіцяла дотримуватися різних пріоритетів політики, якщо вони зможуть досягти більшості в Палаті представників (що вони і зробили). Вони включили в цю діаграму наступну діаграму, щоб проілюструвати, що державні витрати вийшли з-під контролю:

Знімок екрана 2019-10-10 в 11.51.23 PM.png

Пишучи для Нової Республіки, Олександр Харт зазначив, що графік республіканців, починаючи вісь y на 17% і лише піднімаючись до 24%, перебільшує величину збільшення. Ця планка праворуч більш ніж удвічі більша за інші два, але федеральні витрати не подвоїлися. Він підготував наступну альтернативну презентацію даних (Олександр Харт, «Лежачи з графіками, республіканський стиль (зараз на 50% більше графіків)», 22 грудня 2010 року, Нова Республіка. https://newrepublic.com/article/7789...publican-style):

Знімок екрана 2019-10-10 в 11.53.47 PM.png

Написавши для The Washington Post, ліберальний блогер Езра Кляйн пройшов по оригінальному графіку і більш «чесному». Багато його коментаторів (включаючи вашого скромного автора) вказували, що новий графік був надмірною корекцією першого: він мінімізує зміну витрат, приймаючи вісь y аж до 100. Він підготував остаточний графік, який, мабуть, найкращий спосіб представити дані про витрати (Езра Кляйн, «Брехня, чортова брехня та вісь «Y», 23 вересня 2010 року, The Washington Post. http://voices.washingtonpost.com/ezr...he_y_axis.html):

Знімок екрана 2019-10-10 в 11.53.54 PM.png

На осі х теж можна зробити пустощі. У квітні 2011 редакції під назвою «Де податкові гроші», The Wall Street Journal зробив випадок, що пропозиція президента Обами підвищити податки на багатих була поганою ідеєю. (Див. Тут: http://www.wsj.com/articles/SB100014...67113524583554) Якби він дійсно серйозно ставився до підвищення доходів, йому довелося б підвищити податки на середній клас, так як саме там більша частина грошей. Щоб підтвердити це твердження, вони створили такий графік:

Знімок екрана 2019-10-10 в 11.56.44 PM.png

Використовуючи метод генерації гістограм The Wall Street Journal, де кожен бар може представляти будь-яку кількість різних домогосподарств, ви можете «довести» все, що завгодно. Це не багаті або навіть середній клас, за яким ми повинні йти, якщо ми дійсно хочемо збільшити дохід; це бідні. Ось де гроші:

Знімок екрана 2019-10-10 в 11.56.50 PM.png

Є й інші способи, крім діаграм і графіків, щоб візуально представити кількісну інформацію: піктограми. Існує складний і заснований на правилах метод представлення статистичної інформації за допомогою таких зображень. Він був піонером у 1920-х роках австрійським філософом Отто Нейратом і спочатку називався Віденським методом живописної статистики (Wiener Methode der Bildstatistik); врешті-решт він став відомий як Ізотип (Міжнародна система друкарської освіти). (Див тут: https://en.Wikipedia.org/wiki/Isotyp...ture_language)) Принципи системи Нейрата були такими, щоб запобігти оману даних за допомогою піктограм. Мабуть, найголовніше правило полягає в тому, що більші кількості повинні бути представлені не більшими картинками, а більшою кількістю однакових за розміром картинок. Наприклад, якби я хотів представити той факт, що вітчизняний видобуток нафти в Сполучених Штатах за останні кілька років подвоївся, я міг би скористатися наступним зображенням (я використовую цей приклад у класі протягом багатьох років, і щось підказує мені, що я отримав його з чужої книги, але я переглянув всі книги на моїх полицях і не можу знайти. Так що, можливо, я видумав це сам. Але якщо я цього не зробив, ця виноска визнає, хто це зробив. (Якщо ви така людина, дайте мені знати!)) :

Знімок екрана 2019-10-10 в 11.57.07 PM.png

Було б оманливим порушувати принципи Нейрата і замість цього представляти збільшення з більшим стовбуром:

Знімок екрана 2019-10-10 в 11.57,14 PM.png

Все, що я зробив, це подвоїти розмір зображення. Але я подвоїв його в обох вимірах: він і в два рази ширше, і в два рази вище. Більше того, оскільки нафтові барелі є тривимірними об'єктами, я також зобразив бочку праворуч, що вдвічі глибше. Важливою річчю нафтових барелів є те, скільки нафти вони можуть вмістити - їх обсяг. Подвоївши барель у всіх трьох вимірах, я зобразив бочку праворуч, яка може вмістити 8 разів більше нафти, ніж ліворуч. Те, що я показую, - це не подвоєння видобутку нафти; це восьмикратне збільшення.

На жаль, люди весь час порушують правила Нейрата і в кінцевому підсумку (навмисно чи ні) перебільшують явища, які вони намагаються зобразити. Метью Іглесіас, пише в журналі Architecture, зазначив, що житловий «міхур», який досяг повної інфляції в 2006 році (коли було побудовано багато будинків), не був таким незвичайним. Якщо ви подивитеся на недавню історію, ви побачите подібні цикли буму та бюста, з періодами великої кількості будівель, за якими слідують періоди відносно мало. Журнал підготував графіку, щоб представити дані про будівництво будинку, і Іглесіас зробив точку, щоб опублікувати її у своєму блозі на Slate.com, оскільки вважав, що це ілюстративно. (Див тут: http://www.slate.com/blogs/moneybox/... _shortage.html) Ось графіка:

Знімок екрана 2019-10-11 о 12.01.00 AM.png

Це вражаюча фігура, але вона перебільшує коливання, які вона намагається зобразити. Пікограми масштабуються до цифр у маленьких будинках (які представляють кількість будинків, побудованих за дані місяці), але в обох вимірах. І, звичайно, будинки - це тривимірні об'єкти, так що хоча картина не відображає третього виміру, наш несвідомий розум знає, що ці маленькі домашні особи мають об'єм. Таким чином, січня 2006 будинок (2,273) більш ніж в п'ять разів ширше і вище, ніж будинок квітня 2009 (478). Але п'ять разів в трьох вимірах: 5 х 5 х 5 = 125. Будинок січня 2006 року більше 125 разів більше, ніж будинок квітня 2009 року; ось чому це виглядає так, як у нас є особняк поруч з сараєм. Протягом багатьох років були коливання в житловому будівництві, але вони не були такими великими, як ця графіка робить їх здаватися.

Одна всюдисуща картина, яку легко неправильно інтерпретувати, не тому, що хтось порушив правила Нейрата, а просто через те, як все відбувається у світі, - це карта Сполучених Штатів. Що робить його складним, полягає в тому, що розміри окремих держав не пропорційні їх населенню. Це має ефект перебільшення певних явищ. Розглянемо остаточні результати президентських виборів 2016 року, зображені, як вони зазвичай є, із державами, які пішли за кандидата від республіканців червоним кольором та тими, що пішли за демократа синім кольором. Це те, що ви отримуєте (Джерело зображення: https://en.Wikipedia.org/wiki/Electo...United_States)):

Знімок екрана 2019-10-11 о 12.01.15 AM.png

Подивіться на все, що червоне! Клінтон, мабуть, потрапив. Окрім цього вона не зробила: вона виграла народне голосування більш ніж на три мільйони. Схоже, що є набагато більше голосів Трампа, тому що він виграв багато держав, які є дуже великими, але містять дуже мало виборців. Ці штати Великих рівнин величезні, але навряд чи хтось там живе. Якби ви скоригували карту, зробивши розміри штатів пропорційними їх населенню, ви б закінчили щось подібне (там же):

Знімок екрана 2019-10-11 о 12.01.20 AM.png

І це лише часткова корекція: це розміри штатів виборцями в колегії вибірників; що все ще перебільшує розміри деяких з тих менш населених штатів. Справжнє коригування повинно було б показати більше синього, ніж червоного, оскільки Клінтон виграла більше голосів загалом.

Я закінчу прикладом, вкраденим безпосередньо з натхнення для цього розділу - Даррелл Хафф «Як брехати зі статистикою». (стор. 103) Це карта Сполучених Штатів, зроблена для підняття тривоги щодо суми витрат, що здійснюються федеральним урядом (вона була виготовлена понад півстоліття тому; деякі речі ніколи не змінюються). Ось він:

Знімок екрана 2019-10-11 о 12.01.26 AM.png

виготовив власну карту («Східний стиль»), затінюючи різні держави, однакову загальну чисельність населення:

Знімок екрана 2019-10-11 о 12.01.32 AM.png

Не так вже й тривожно.

Люди намагаються обдурити вас так багато різних способів. Єдиний захист - це трохи логіки, і ціла маса скептицизму. Будьте пильні!