6.3: Ймовірність і віра - Байєсівські міркування
- Page ID
- 50937
Великий шотландський філософ Девід Хьюм у своєму запиті щодо розуміння людини писав: «У наших міркуваннях, що стосуються факту, є всі мислимі ступені впевненості, від найвищої впевненості до найнижчих видів моральних доказів. Тому мудра людина пропорціонує свою віру доказам». Юм робить дуже важливий момент щодо свого роду міркувань, якими ми займаємось щодня: коригування переконань у світлі доказів. Ми віримо в речі з різним ступенем впевненості, і коли ми робимо спостереження або дізнаємося нові речі, які впливають на ці переконання, ми вносимо корективи в наші переконання, стаючи більш-менш впевненими відповідно. Або, принаймні, це те, що ми повинні зробити. Точка Юма є важливою, оскільки занадто часто люди не коригують свої переконання, коли стикаються з доказами-особливо доказами проти їхніх заповітних думок. Не потрібно далеко дивитися, щоб побачити, як люди поводяться таким чином: наполегливість і повсюдність переконань, наприклад, що вакцини викликають аутизм, або що глобальне потепління - це міф, незважаючи на переважні докази протилежного, є свідченням поширеної нездатності людей співвідносити свої переконання з докази, до загальної відсутності «мудрості», як висловлює Юм.
Тут у нас є процес міркування - коригування переконань у світлі доказів - який можна зробити добре чи погано. Нам потрібен спосіб відрізнити хороші екземпляри такого роду міркувань від поганих. Нам потрібна логіка. Як це трапляється, інструменти побудови такої логіки готові до рук: ми можемо використовувати обчислення ймовірностей для оцінки такого роду міркувань.
Наша логіка буде простою: це буде формула, що забезпечує абстрактну модель цілком раціонального переконання-ревізії. Формула підкаже, як обчислити умовну ймовірність. Він названий на честь англійського преподобного 18-го століття, який вперше сформулював його: Томас Байес. Він називається «Закон Байєса», а міркування відповідно до його стриктур називають «байєсовськими міркуваннями».
У цей момент ви, природно, запитаєте себе приблизно так: «Що на Землі теорема про ймовірність має відношення до коригування переконань на основі доказів?» Відмінне питання; Я радий, що ви запитали. Як згадував Хьюм у цитаті, з якої ми почали, наші переконання приходять з різним ступенем впевненості. Ось, наприклад, три речі, які я вважаю:
- 1 + 1 = 2;
- земля знаходиться приблизно в 93 млн миль від Сонця (в середньому);
- Я маю відношення до Вінстона Черчілля.
Я перерахував їх у порядку спадання: я найбільш впевнений у (а), найменш впевнений у (c). Я більш впевнений у (a), ніж (b), оскільки я можу зрозуміти, що 1 + 1 = 2 самостійно, тоді як я повинен покладатися на свідчення інших щодо відстані Землі до Сонця. Тим не менш, це свідчення дає мені набагато сильнішу віру, ніж свідчення, яке є джерелом (c). Моє відношення до Черчілля, мабуть, через мою бабусю по материнській лінії; деталі туманні. Тим не менш, вона і всі інші в родині завжди говорили, що ми пов'язані з ним, тому я вірю в це.
«Добре, - думаєте ви, - але як це має відношення до ймовірностей?» Наші ступені віри в конкретні претензії можуть варіюватися між двома крайнощами: повним сумнівом і абсолютною впевненістю. Ми могли б призначити числа цим станам: повний сумнів дорівнює 0; абсолютна впевненість - 1. Ймовірності також варіюються в межах від 0 до 1! Природно представляти ступені переконань як ймовірності. Це одна з філософських інтерпретацій того, що таке ймовірності насправді. (На це є ціла література. Дивіться цю статтю для огляду: Гаек, Алан, «Інтерпретації ймовірності», Стенфордська енциклопедія філософії (видання зима 2012 року), Едвард Н. Залта (ред.), URL = < https://plato.stanford.edu/archives/...ity-interpret/ >.) Це так зване «суб'єктивне» тлумачення, оскільки ступені переконання є суб'єктивними станами розуму; ми називаємо ці «особисті ймовірності». Подумайте про прокатку плашки. Імовірність того, що він з'явиться, показуючи один, дорівнює 1/6. Один із способів зрозуміти, що це означає, це сказати, що перед тим, як померти було кинуто, ступінь, до якої ви вірили, що пропозиція про те, що померти прийде, показуючи одну - кількість впевненості, яку ви мали в цій претензії - була 1/6. Ви б мали більше впевненості у твердженні, що це прийде, показуючи непарне число - ступінь віри 1/2.
Ми говоримо про процес перегляду наших переконань, коли ми стикаємося з доказами. З точки зору ймовірностей, це означає підвищення або зниження наших особистих ймовірностей, як це підтверджено доказами. Припустимо, наприклад, що я відвідував рідне місто бабусі і зіткнувся з її другом з зворотного шляху. В ході розмови згадую, як бабуся була пов'язана з Черчіллем. «Це смішно, - каже друг, - ваша бабуся завжди казала мені, що має відношення до Муссоліні». Я щойно отримав деякі докази, які несуть на моєму переконанні, що я пов'язаний з Черчіллем. Я ніколи раніше не чув цього претензії Муссоліні. Я починаю підозрювати, що у моєї бабусі був дивний ексцентричність: їй подобалося розповідати людям, що вона пов'язана з відомими лідерами під час Другої світової війни. (Цікаво, чи вона коли-небудь стверджувала, що має відношення до Сталіна. ФДР? Давайте помолимося, Гітлера ніколи не закликали. І Хірохіто напружував би довірливість; моя бабуся явно не була японкою.) У відповідь на ці докази, якщо я буду раціональним, я б переглянув своє переконання в тому, що я пов'язаний з Вінстоном Черчіллем: я б знизив свою особисту ймовірність цієї віри; я б повірив у це менш сильно. Якщо, з іншого боку, мій візит до рідного міста моєї бабусі дав різні докази - скажімо, родич зробив відповідне дослідження і створив сімейну генеалогію, яка відстежує відношення до Черчілла - тоді я б переглянув свою віру в іншому напрямку, збільшуючи свою особисту ймовірність, вважаючи це сильніше.
Оскільки перегляд переконань у цьому сенсі якраз передбачає коригування ймовірностей, наша модель того, як вона працює, є лише засобом обчислення відповідних ймовірностей. Ось чому наша логіка може приймати форму рівняння. Ми хочемо знати, наскільки сильно ми повинні вірити чомусь, враховуючи деякі докази про це. Це умовна ймовірність. Нехай «\(H\)» стояти за загальну гіпотезу - те, що ми віримо в тій чи іншій мірі; нехай «Е» виступає за деякі докази, які ми виявляємо. Те, що ми хочемо знати, так це як обчислити\(P(H | E)\) — ймовірність\(H\) даної\(E\), наскільки сильно ми повинні вірити\(H\) в світлі відкриття\(E\).
Закон Байєса розповідає нам, як виконати цей розрахунок. Ось одна з версій рівняння (Це легко вивести цю теорему, починаючи з загального правила продукту. Ми знаємо
\[\mathrm{P}(\mathrm{E} \bullet \mathrm{H})=\mathrm{P}(\mathrm{E}) \times \mathrm{P}(\mathrm{H} | \mathrm{E})\]
незалежно від того, що «E» і «H» означають. Маленька алгебраїчна маніпуляція дає нам
\[P(H | E)=\dfrac{P(E \bullet H)}{P(E)}\]
Це правда логіки, що вираз «E • H» еквівалентно 'H • E', тому ми можемо замінити 'P (E • H) 'на 'P (H • E)' в чисельнику. І знову, за загальним правилом добутку, Р (Н • Е) = Р (Н) х Р (Е | Н) —наш кінцевий чисельник. ):
\[\mathrm{P}(\mathrm{H} | \mathrm{E})=\frac{\mathrm{P}(\mathrm{H}) \times \mathrm{P}(\mathrm{E} | \mathrm{H})}{\mathrm{P}(\mathrm{E})}\]
Це рівняння має деякі приємні особливості. Перш за все, наявність «P (H)» в чисельнику інтуїтивно зрозуміле. Це часто називають «попередньою ймовірністю» (або «попередньою» коротко); це ступінь, в якій гіпотеза вважалася до відкриття доказів. Має сенс, що це було б частиною розрахунку: наскільки сильно я вірю у щось зараз має бути (принаймні частково) функцією того, наскільки сильно я вважав це. По-друге, 'P (E | H) 'є корисним елементом для розрахунку, оскільки часто це ймовірність, яку можна знати. Зверніть увагу, це зворотна умовна ймовірність, яку ми намагаємося обчислити: це ймовірність доказів, припускаючи, що гіпотеза істинна (може і не бути, але ми припускаємо, що це, як кажуть, «заради аргументу»). Розглянемо приклад: як ви знаєте, хворіти вранці може бути ознакою вагітності; якби це відбувалося з вами, гіпотеза, яку ви б розважали, полягала б у тому, що ви вагітні, а свідченням буде блювота вранці. Умовна ймовірність, що вас цікавить, - це P (вагітна | блювота) - тобто ймовірність того, що ви вагітні, враховуючи, що вас кидали вранці. Частина використання закону Байєса для цього розрахунку передбачає зворотну цю умовну ймовірність: P (блювота | вагітна) - ймовірність того, що ви будете кидати вранці, припускаючи (заради аргументу), що ви насправді вагітні. І це те, що ми можемо просто подивитися вгору; дослідження були зроблені. Виявляється, близько 60% жінок відчувають ранкову нудоту (аж до кидання вгору) протягом першого триместру вагітності. Є багато таких фактів доступні. Чи знали ви, що тяга до льоду - потенційна ознака анемії? Мабуть, це так: 44% хворих на анемію мають бажання їсти лід. Подібні приклади знайти неважко. Крім того, варто відзначити, що іноді зворотна ймовірність, про яку йдеться\(P(E | H)\) — дорівнює 1. У разі передбачення, зробленого науковою гіпотезою, це так. Наприклад, теорія всесвітнього тяжіння Ісаака Ньютона передбачає, що об'єкти, скинуті з однієї висоти, займуть однакову кількість часу, щоб досягти землі, незалежно від їх ваги (за умови, що опір повітря не є фактором). Це передбачення є лише математичним результатом рівняння, що регулює гравітаційне тяжіння. Отже, якщо\(H\) теорія Ньютона і\(E\) це куля для боулінгу і перо, що займає стільки ж часу, щоб впасти, то\(P(E | H) = 1\); якщо теорія Ньютона вірна, то це математична впевненість, що докази будуть спостерігатися. (За умови, що ви налаштовуєте речі ретельно. Перевірте це відео: https://www.youtube.com/watch?v=E43-CfukEgs. )
Таким чином, ця версія закону Байєса приваблива через обидві ймовірності в чисельнику:\(P(H)\), попередня ймовірність, є природною, оскільки скоригована ступінь переконання повинна залежати від попереднього ступеня переконання; і\(P(E | H)\) корисна, оскільки це ймовірність, що ми часто можемо точно знати. Формула також приємна тим, що вона добре поєднується з нашою інтуїцією про те, як повинна працювати віра-ревізія. Робиться це трьома способами.
По-перше, ми знаємо, що неправдоподібним гіпотезам важко змусити людей повірити; як одного разу висловився Карл Саган, «Надзвичайні претензії вимагають надзвичайних доказів». Якщо говорити про це з точки зору особистих ймовірностей, неправдоподібна гіпотеза - і надзвичайна претензія - це лише одна з низьким попереднім:\(P(H)\) це невелика частка. Розглянемо приклад. Одразу після президентських виборів у США 2016 року деякі люди стверджували, що вибори були сфальсифіковані (можливо, Росією) на користь Дональда Трампа шляхом масової схеми комп'ютерного злому, яка маніпулювала підсумками голосів у ключових дільницях. (Примітка: це окремо від вельми правдоподібного твердження про те, що росіяни зламали електронні листи від Демократичного національного комітету і оприлюднили їх до ЗМІ перед виборами.) У мене було дуже мало впевненості в цій гіпотезі - я дав їй надзвичайно низьку попередню ймовірність - з багатьох причин, але дві зокрема: (а) Голосуючі машини в окремих дільницях не пов'язані між собою, тому будь-яка схема злому повинна здійснюватися на машинній основі через сотні - якщо ні тисячі дільниць, операція майже неможливої складності; (б) організація з практично необмеженими фінансовими ресурсами та найсильнішою мотивацією для розкриття такої схеми, а саме кампанії Клінтона, подивилася на дані і зробила висновок, що нічого рибного не відбувається. Але жодне з цього не зупинило бажаних за бажане прихильників Клінтона копати докази того, що насправді виправлення було для Трампа. (Ось репрезентативний виклад: http://www.dailykos.com/story/2016/1...mpaign-Please - Виклик голосування-в-4-держав-як-даних-ви-виграв-NC-P A-WI-FL) Коли люди представили мені такі докази - подивіться на ці підозріло високі показники явки з жменьки дільниць у сільській місцевості Вісконсін! —Моя ступінь віри в гіпотезу - що росіяни зламали вибори - ледве зрушила з місця. Це правильно; знову ж таки, надзвичайні претензії вимагають надзвичайних доказів, і я цього не бачив. Цей інтуїтивний факт про те, як передбачається працювати перегляд переконань, підтверджується рівнянням закону Байєса. Неправдоподібні гіпотези мають низький prior—P (H) - це мала частка. Важко збільшити нашу ступінь віри в такі пропозиції - P (H | E) не легко піднімається - просто тому, що ми множимо на низький дріб у чисельнику при обчисленні нової ймовірності.
Математика відображає фактичну механіку переконання-ревізії ще двома способами. Ось істина: чим сильніше передбачувана частина доказів для даної гіпотези, тим більше вона підтримує цю гіпотезу, коли ми її спостерігаємо. Вище ми бачили, що жінки, які вагітні, відчувають ранкову нудоту близько 60% часу; також пацієнти, які страждають на анемію, жадають льоду (чомусь) 44% часу. Іншими словами, кидання вранці сильніше прогнозує вагітність, ніж тяга до льоду - анемія. Ранкова хвороба збільшить віру в гіпотезу вагітності більше, ніж тяга до льоду збільшить віру в анемію. Знову ж таки, це банальне спостереження підтверджується в рівнянні для закону Байєса. Коли ми обчислюємо, наскільки сильно ми повинні вірити в гіпотезу у світлі доказів - P (H | E) - ми завжди множимо в чисельнику на зворотну умовну ймовірність—P (E | H) - ймовірність того, що ви будете спостерігати докази, припускаючи, що гіпотеза істинна. Для вагітності/хвороби це означає множення на 0,6; для анемії/тяги до льоду ми множимо на ,44. У першому випадку ми множимо на більшу кількість, тому наша ступінь віри збільшується більше.
Третій інтуїтивний факт про перегляд переконань, який правильно фіксує наше рівняння, полягає в наступному: дивовижні докази дають вагоме підтвердження гіпотези. Розглянемо на прикладі загальної теорії відносності Альберта Ейнштейна, яка надала новий спосіб розуміння гравітації: наявність масивних об'єктів у певній області простору впливає на геометрію самого простору, викликаючи його викривлення в цій околицях. Теорія Ейнштейна має ряд дивовижних наслідків, одним з яких є те, що, оскільки простір викривлений навколо масивних об'єктів, світло не буде подорожувати по прямій лінії в цих місцях. (Або, це подорож прямою лінією, просто через простір, який вигнутий. Те ж саме.) У цьому прикладі H є загальною теорією відносності Ейнштейна, а Е - спостереження за світлом, що йде за кривим шляхом. Коли Ейнштейн вперше висунув свою теорію в 1915 році, наукове співтовариство зустріло її з недовірливістю, не в останню чергу через це дивовижне передбачення. Легкий вигин? Божевільний! І все ж через чотири роки Артур Еддінгтон, англійський астроном, розробив і виконав експеримент, в якому саме такий ефект спостерігався. Він фотографував зірки на нічному небі, потім тримав свою камеру тренованою на тому ж місці і зробив ще один знімок під час затемнення сонця (єдиний раз, коли зірки також будуть видні вдень). Нова картина показала зірки в дещо інших положеннях, тому що під час затемнення їх світло повинен був проходити біля сонця, маса якого змусила їх шлях трохи відхилитися, так само, як і передбачав Ейнштейн. Як тільки Еддінгтон оприлюднив свої результати, газети всього світу оголосили про підтвердження загальної відносності і Ейнштейн став зіркою. Як ми вже говорили, дивовижні результати дають сильне підтвердження; навряд чи щось може бути більш дивним, що легкий вигин. Ми можемо поставити це з точки зору особистих ймовірностей. Вигин світла був доказом, тому P (E) являє собою ступінь віри, яку хтось мав би у пропозиції, що світло буде подорожувати пишним шляхом. Це було дуже низьке число до експериментів Еддінгтона. Коли ми використовуємо це, щоб обчислити, наскільки сильно ми повинні вірити в загальну відносність, враховуючи докази того, що світло насправді згинається - P (H | E) - це знаменник нашого рівняння. Ділення на дуже дрібний дріб означає множення на її зворотне, яке є дуже великим числом. Це змушує P (H | E) різко зростати. Знову ж таки, математика відображає фактичну практику міркування.
Отже, наша початкова формулювання закону Байєса має ряд привабливих особливостей; вона добре поєднується з нашою інтуїцією щодо того, як насправді працює перегляд переконань. Але це не версія закону Байєса, що ми будемо погоджуватися на фактичних розрахунках. Замість цього ми будемо використовувати версію, яка замінює знаменник — P (E) —чимось іншим. Це тому, що цей термін трохи складний. Це попередня ймовірність доказів. Це ще один суб'єктивний стан - наскільки сильно ви вірили, що докази будуть спостерігатися до його фактичного спостереження або щось подібне. Суб'єктивність не є поганою річчю в цьому контексті; ми намагаємося з'ясувати, як налаштувати суб'єктивні стани (ступені переконання), врешті-решт. Але чим більше її ми зможемо зняти з розрахунку, тим надійніше наші результати. Як ми обговорювали, суб'єктивна попередня ймовірність для даної гіпотези - P (H) - належить до нашого рівняння: наскільки сильно ми віримо в щось зараз, має бути функцією того, наскільки сильно ми звикли вірити в це. Інший пункт у чисельнику - P (E | H) - є найбільш вітальним, оскільки це те, що ми часто можемо просто подивитися вгору - об'єктивний факт. А ось Р (Е) проблематично. Це має сенс у випадку легкого вигину і загальної відносності. Але розглянемо приклад, коли я стикаюся зі старим знайомим моєї бабусі, і вона розповідає мені про свої претензії на зв'язок з Муссоліні. Що було моїм попереднім для цього? Незрозуміло, що навіть був такий; можливість, ймовірно, ніколи навіть не приходила в голову. Я хотів би позбутися теперішнього знаменника і замінити його видами термінів, які мені подобаються - ті, що знаходяться в чисельнику.
Я можу зробити це досить легко. Щоб побачити, як, буде корисно врахувати той факт, що коли ми оцінюємо гіпотезу у світлі деяких доказів, часто існують альтернативні гіпотези, з якими вона конкурує. Припустимо, у мене є смішна висип на моїй шкірі; це докази. Я хочу знати, що це спричиняє. Я можу придумати ряд можливих пояснень. Це зима, тому, можливо, це просто суха шкіра; це одна гіпотеза. Назвіть це «H1'. Інша можливість: ми тільки почали використовувати новий пральний порошок в моєму будинку; можливо, у мене є реакція. Н2 = миючий засіб. Можливо, це серйозніше, хоча. Я потрапляю в Google і починаю пошук. Н3 = псоріаз (різновид шкірного захворювання). Тоді моя іпохондрія виходить з-під контролю, і я дуже лякаюся: Н4 = проказа. Це все, що я можу придумати, але це може бути не будь-яка з них: H5 = якась інша причина.
У мене є п'ять можливих пояснень мого висипу - п'ять гіпотез, в які я міг би повірити певною мірою у світлі доказів. Зверніть увагу, що список вичерпний: оскільки я додав Н5 (щось інше), одна з п'яти гіпотез пояснить висип. Оскільки це так, ми можемо з упевненістю сказати, що у мене висип, і це викликано холодом, або у мене висип, і це викликано миючим засобом, або у мене висип, і це викликано псоріазом, або у мене висип, і це викликано проказою, або у мене висип і це викликано чимось іншим. Взагалі кажучи, коли список гіпотез вичерпний можливостей, наступне є істина логіки:
\[E ≡ (E • H_1) ∨ (E • H_2) ∨ ... ∨ (E • H_n)\]
Для кожного з сполучників неважливо, в якому порядку ви ставите кон'юнкти, так що це вірно теж:
\[E ≡ (H_1 •E) ∨ (H_2 •E) ∨ ... ∨ (H_n •E)\]
Пам'ятайте, що ми намагаємося замінити P (E) в знаменник нашої формули. Ну а якщо Е еквівалентна цій довгій диз'юнкції, то P (E) дорівнює ймовірності диз'юнкції:
\[P(E) = P[(H_1 •E) ∨ (H_2 •E) ∨ ... ∨ (H_n •E)]\]
Ми обчислюємо диз'юнктивну ймовірність. Якщо припустити, що гіпотези взаємовиключні (правда може бути тільки одна з них), то можна скористатися Правилом простого додавання (я знаю. У прикладі, можливо, це холодна погода і новий миючий засіб викликає мою висипання. Давайте відкладемо цю можливість в сторону. ):
\[P(E) = P(H_1 • E) + P(H_2 • E) + ... + P(H_n • E)\]
Кожен елемент в сумі - це кон'юнктивний розрахунок ймовірності, для якого ми можемо використовувати Загальне правило продукту:
\[P(E) = P(H_1) \times P(E | H_1) + P(H_2) \times P(E | H_2) + ... + P(H_n) \times P(E | H_n)\]
І подивіться, що ми маємо там: кожен елемент у сумі тепер є добутком точно двох типів термінів, які мені подобаються - попередня ймовірність гіпотези, і зворотна умовна ймовірність доказів, припускаючи, що гіпотеза вірна (те, що я часто можу просто подивитися вгору). Мені не сподобався мій старий знаменник, але це еквівалентно тому, що я люблю. Так що я його заміню. Це наша остаточна версія закону Байєса:
\[\mathrm{P}\left(\mathrm{H}_{\mathrm{k}} | \mathrm{E}\right)=\frac{\mathrm{P}\left(\mathrm{H}_{\mathrm{k}}\right) \times \mathrm{P}\left(\mathrm{E} | \mathrm{H}_{\mathrm{k}}\right)}{\mathrm{P}\left(\mathrm{H}_{1}\right) \times \mathrm{P}\left(\mathrm{E} | \mathrm{H}_{1}\right)+\mathrm{P}\left(\mathrm{H}_{2}\right) \times \mathrm{P}\left(\mathrm{E} | \mathrm{H}_{2}\right)+\ldots+\mathrm{P}\left(\mathrm{H}_{\mathrm{n}}\right) \times \mathrm{P}\left(\mathrm{E} | \mathrm{H}_{\mathrm{n}}\right)}\]
с\(1 \leq \mathrm{k} \leq \mathrm{n}\).
(Ми додаємо індекс «\(k\)'до гіпотези, яку ми розважаємо, і обумовлюємо, що k знаходиться між 1 і n просто для того, щоб гарантувати, що гіпотеза, про яку йде мова, входить до набору вичерпних, взаємовиключних можливостей\(H_1\)\(H_2\),,...,\(H_n\).)
Давайте подивимося, як це працює на практиці. Розглянемо наступний сценарій розвитку подій:
Ваша мама робить продуктові покупки у вашому домі. Вона ходить у два магазини: Fairsley Foods і ринок Гіббонса. Gibbons 'в ближче до дому, тому вона ходить туди частіше - 80% часу. Fairsley іноді має великі угоди, хоча, тому вона їздить на додаткову відстань і магазини там 20% часу.
Ти не витримаєш Ферслі. Перш за все, вони отримали ці дратівливі рекламні ролики з божевільним власником, що кричить в камеру і діє як дурня. По-друге, ви заблукали там одного разу, коли ви були маленькою дитиною, і у вас все ще є емоційні шрами. Нарешті, їх розділ продуктів жахливий: зокрема, їх персики - ваш улюблений фрукт - часто борошнисті і м'які, практично неїстівні. Насправді, ви настільки одержимі хорошими персиками, що вивчили його, збираючи зразки протягом певного періоду часу з обох магазинів, дегустуючи та записуючи свої дані. Виявляється, персики з Ферслі погані 40% часу, тоді як ті з Гіббонса - лише погані 20% часу. (Персики - непостійний плід; ви повинні очікувати деяких поганих, незалежно від того, наскільки ви дбаєте.)
У будь-якому випадку, одного прекрасного дня ви заходите на кухню і помічаєте нагромадження персиків у кошику з фруктами; мама, мабуть, просто пішла по магазинах. Облизуючи губи, ви хапаєте персик і перекушуєте. Тьфу! Борошнистий, м'який—жахливий. «Дурний Ферслі», ви бурмотете, коли випльовуєте плід. Питання: чи раціональна ваша віра в те, що персик прийшов з Ферслі? Наскільки сильно ви повинні вірити, що він прийшов з того магазину?
Це питання Байєса Закон може допомогти нам відповісти. Це запитує нас про те, наскільки сильно ми повинні вірити в щось; це просто обчислення (умовної) ймовірності. Ми хочемо знати, наскільки сильно ми повинні вірити, що персик походить від Ферслі; це наша гіпотеза. Давайте назвемо це «F». Ці типи обчислень завжди мають умовні ймовірності: ми хочемо, щоб ймовірність гіпотези дала докази. У цьому випадку доказом є те, що персик був поганим; назвемо це «Б». Отже, ймовірність, яку ми хочемо обчислити, є P (F | B) - ймовірність того, що персик прийшов від Ферслі, враховуючи, що це погано.
На цьому етапі ми посилаємося на Закон Байєса і вставляємо речі в формулу. У чисельнику ми хочемо попередньої ймовірності для нашої гіпотези, а зворотна умовна ймовірність доказів, припускаючи, що гіпотеза вірна:
\[\mathrm{P}(\mathrm{F} | \mathrm{B})=-\frac{\mathrm{P}(\mathrm{F}) \times \mathrm{P}(\mathrm{B} | \mathrm{F})}{\test{ }}\]
У знаменнику нам потрібна сума, причому кожен член в сумі має точно таку ж форму, як і наш чисельник: попередня ймовірність для гіпотези, помножена на зворотну умовну ймовірність. Сума повинна мати один такий термін для кожної з наших можливих гіпотез. У нашому сценарії всього два: що плід прийшов з Ферслі, або що він прийшов від Гіббонса. Назвемо другу гіпотезу «Г». Наш розрахунок виглядає наступним чином:
\[\mathrm{P}(\mathrm{F} | \mathrm{B})=\frac{\mathrm{P}(\mathrm{F}) \times \mathrm{P}(\mathrm{B} | \mathrm{F})}{\mathrm{P}(\mathrm{F}) \times \mathrm{P}(\mathrm{F} | \mathrm{B})+\mathrm{P}(\mathrm{G}) \mathrm{x} \mathrm{P}(\mathrm{F} | \mathrm{G})}\]
Тепер нам просто потрібно знайти конкретні цифри для цих різних ймовірностей у нашій маленькій історії. По-перше, P (F) - це попередня ймовірність персика, що надходить від Fairsley - тобто ймовірність того, що ви б призначили йому, що надходить від Ферслі, перш ніж виявити докази того, що це було погано - перш ніж ви взяли укус. Ну, ми знаємо мамині звички покупок: 80% часу вона ходить до Гіббонса; 20% часу вона їде до Ферслі. Отже, випадковий шматок їжі - наприклад, наш персик - має 20% ймовірності надходження від Ферслі. Р (Ф) = .2. І з цього приводу, персик має 80% вірогідність походу від Гіббонса, тому попередня ймовірність для цієї гіпотези - P (G) - становить .8. А як щодо P (B | F)? Це умовна ймовірність того, що персик буде поганим, якщо припустити, що він прийшов від Ферслі. Ми це знаємо! Ви провели систематичне дослідження і дійшли висновку, що 40% персиків Ферслі погані; P (B | F) = .4. Більше того, ваше дослідження показало, що 20% персиків з Гіббонса були поганими, тому P (G | F) = .2. Тепер ми можемо підключити цифри і зробити розрахунок:
\[P(F | B)=\frac{0.2 \times 0.4}{(0.2 \times 0.4)+(0.8 \times 0.2)}=\frac{0.08}{0.08 + 0.16}=-\frac{1}{3}\]
Насправді, ймовірність того, що поганий персик, який ви скуштували, прийшов від Fairsley - висновок, до якого ви стрибнули, як тільки ви укусили - становить лише 1/3. Вдвічі частіше, що персик походить від Гіббонса. Ваша віра не є раціональною. Незважаючи на те, що персики Fairsley погані в два рази більше, ніж Gibbons ', набагато більш імовірно, що ваш персик прийшов з Гіббонса, головним чином тому, що ваша мама робить набагато більше своїх покупок там.
Отже, тут ми маємо приклад закону Байєса, що виконує функцію логіки - надання методу відрізнення хорошого від поганих міркувань. Виявляється, наша маленька історія зобразила екземпляр останнього, і Закон Байєса показав, що міркування були поганими, надаючи стандарт, за яким можна його виміряти. Закон Байєса, щодо цього тлумачення, є зразком цілком раціонального переконання-перегляду. Звичайно, багато реальних прикладів такого роду міркувань не можуть бути піддані суворому аналізу, який дозволили (склали) числа в нашому сценарії. Коли ми насправді коригуємо наші переконання у світлі доказів, нам часто не вистачає точних цифр; ми не ходимо з калькулятором та індексною карткою із законом Байєса на ньому, хрусткі цифри кожного разу, коли ми дізнаємося нові речі. Тим не менш, наші фактичні практики повинні бути поінформовані байєсівськими принципами; вони повинні наблизити вид суворого процесу, прикладом якого є формула. Ми повинні мати на увазі необхідність бути відкритими для коригування наших попередніх переконань, той факт, що альтернативні можливості існують і повинні бути прийняті до уваги, значення ймовірності та невизначеності для наших дискусій про те, у що вірити і як сильно в це вірити. Знову ж таки, Юм: мудра людина пропорції віри відповідно до доказів.
Вправи
1. Жінки вдвічі частіше страждають від тривожних розладів, ніж чоловіки: від 8% до 4%. Вони також частіше відвідують коледж: у ці дні це приблизно 60/40 співвідношення жінок та чоловіків. (Чи пов'язані ці два явища? Це питання для іншого разу.) Якщо випадкова людина вибирається з мого класу логіки, і ця людина страждає тривожним розладом, яка ймовірність того, що це жінка?
2. Припустимо, я волонтер на своїй місцевій виборчій дільниці. Там, де я живу, досить консервативно: 75% виборців - республіканці; лише 25% - демократи (сторонні виборці настільки рідкісні, що їх можна ігнорувати). І вони досить лояльні: виборці, які зазвичай віддають перевагу республіканцям, лише перетинають прохід і голосують демократом 10% часу; зазвичай демократичні виборці змінюють сторони лише 20% часу. У день виборів 2016 (це демократ Хілларі Клінтон проти республіканця Дональда Трампа на пост президента) моя цікавість отримує найкраще з мене, і я повинен заглянути - так що я досягаю купи бюлетенів (зробіть вигляд, що це не електронна скануюча машина підрахунку бюлетенів, а старомодна коробка з паперовими бюлетенями в ньому) і вибрати один навмання. Це голосування за Хілларі. Яка ймовірність того, що він був кинутий (зазвичай) республіканським виборцем?
3. Серед жителів Вісконсіна 80% - вболівальники Green Bay Packers, 10% - вболівальники «Чикаго Ведмеді», а 10% віддають перевагу деякій іншій футбольній команді (ми припускаємо, що кожен Вісконсиніт має улюблену команду). Вболівальники Packer не бояться показати свій дух: 75% з них носять одяг із логотипом команди. Любителі ведмедів досить неохоче виявляють свою лояльність на такій ворожій території, тому лише 25% з них досить огидні, щоб носити одяг Ведмедів. Вболівальники інших команд не так страшні: 50% з них носять спорядження своїх команд. У мене є сусід, який не носить одяг з логотипом улюбленої команди. Підозрілі (FIB?). Яка ймовірність, що він фанат Ведмедів?
4. У моєму класі з логіки 20% учнів є дедбітами: на іспитах вони просто вгадують випадковим чином. 60% учнів досить хороші, але невражаючі: вони отримують правильні відповіді 80% часу. Решта 20% учнів - генії: вони отримують правильні відповіді 100% часу. Я даю істинний/помилковий іспит. Після цього я вибираю один із завершених іспитів навмання; студент отримав перші два питання правильно. Яка ймовірність того, що це один з мертвих ударів?