5.12: Базові ставки
- Page ID
- 98353
Цілі навчання
- Обчислити ймовірність умови з хітів, помилкових тривог та базових ставок за допомогою діаграми дерева
- Обчислити ймовірність умови з хітів, помилкових тривог та базових ставок за допомогою теореми Байєса
Припустимо, що на вашому регулярному фізичному огляді ви тест позитивний на Хвороба\(X\). Хоча хвороба\(X\) має лише легкі симптоми, ви стурбовані і запитайте свого лікаря про точність тесту. Виходить, що тест\(95\%\) точний. Здавалося б, ймовірність того, що у вас\(X\) є Хвороба, тому\(0.95\). Однак ситуація не така проста.
З одного боку, потрібна додаткова інформація про точність тесту, оскільки існує два види помилок, які може зробити тест: промахи та помилкові спрацьовування. Якщо у вас насправді є хвороба,\(X\) і тест не зміг її виявити, це було б промахом. Якщо у вас не було\(X\) Хвороба, і тест вказував, що ви зробили, це було б помилково позитивним. Показники пропуску та помилково позитивні не обов'язково однакові. Наприклад, припустимо, що тест точно вказує на захворювання у\(99\%\) людей, які його мають, і точно вказує на відсутність захворювання у\(91\%\) людей, які його не мають. Іншими словами, тест має показник пропускання\(0.01\) і помилково позитивний показник\(0.09\). Це може призвести до того, що ви переглянете своє судження та дійдете висновку, що ваш шанс захворювання є\(0.91\). Це було б неправильно, оскільки ймовірність залежить від частки людей, які мають захворювання. Ця пропорція називається базовою ставкою.
Припустимо,\(X\) що Хвороба - рідкісне захворювання, і тільки\(2\%\) у людей у вашій ситуації воно є. Як це впливає на ймовірність того, що у вас є? Або, загалом, яка ймовірність того, що хтось, хто позитивно тестує, насправді має хворобу? Розглянемо, що було б, якби був перевірений мільйон людей. З них один мільйон людей,\(2\%\) або\(20,000\) люди мали б захворювання. \(20,000\)З них із захворюванням тест точно виявить його у\(99\%\) них. Це означає, що\(19,800\) випадки були б точно ідентифіковані. Тепер розглянемо мільйона людей (\(980,000\)), які не мають захворювання.\(98\%\) Оскільки помилково позитивний показник є\(0.09\),\(9\%\) з цих\(980,000\) людей буде тест позитивний на захворювання. Це загальна кількість\(88,200\) людей, неправильно поставлених діагнозом.
Підводячи підсумок,\(19,800\) люди, які випробували позитивний результат, насправді мали б хворобу, а\(88,200\) люди, які тестували позитивно, не мали б захворювання. Це означає, що з усіх тих, хто випробував позитивний результат, тільки
\[\dfrac{19,800}{19,800 + 88,200} = 0.1833\]
з них насправді було б захворювання. Так що ймовірність того, що у вас захворювання немає\(0.95\), або\(0.91\), а тільки\(0.1833\).
Ці результати зведені в табл\(\PageIndex{1}\). Числа людей, у яких діагностовано захворювання, показані червоним кольором. З одного мільйона людей, випробуваних, тест був правильним для\(891,800\) тих, хто не має хвороби та для\(19,800\) хвороби; тест був правильним\(91\%\) того часу. Однак, якщо ви подивитеся лише на людей, які тестують позитивно (показані червоним кольором), лише\(19,800 (0.1833)\) з позитивних\(88,200 + 19,800 = 108,000\) тестів насправді мають захворювання.
| Справжня умова | |||
|---|---|---|---|
|
Без хвороб 980 000 |
Хвороба 20 000 |
||
|
Результат тесту |
Результат тесту |
||
|
Позитивні 88,200 |
Негативний 891 800 |
Позитивні 19 800 |
Негативний 200 |
Теорема Байєса
Цей же результат можна отримати за допомогою теореми Байєса. Теорема Байєса враховує як попередню ймовірність події, так і діагностичне значення тесту для визначення задньої ймовірності події. Для поточного прикладу подія полягає в тому, що у вас Хвороба\(X\). Давайте назвемо цю подію\(D\). Оскільки лише\(2\%\) люди у вашій ситуації мають захворювання\(X\), попередня ймовірність події\(D\) є\(0.02\). Або, більш формально,\(P(D) = 0.02\). Якщо\(P(D')\) представляє ймовірність того, що Event\(D\) є помилковим, то\(P(D') = 1 - P(D) = 0.98\).
Щоб визначити діагностичну цінність тесту, нам потрібно визначити іншу подію: що у вас позитивний тест на Хвороба\(X\). Давайте назвемо цю подію\(T\). Діагностичне значення тесту залежить від ймовірності, яку ви отримаєте позитивний результат, враховуючи, що у вас насправді є захворювання, написане як\(P(T|D)\), і ймовірність того, що ви тест позитивний, враховуючи, що у вас немає захворювання, написане як\(P(T|D')\). Теорема Байєса, показана нижче, дозволяє обчислити\(P(D|T)\), ймовірність того, що у вас є захворювання, враховуючи, що ви тест позитивний на нього.
\[P(D|T)=\frac{P(T|D)P(D)}{P(T|D)P(D)+P(T|D')P(D')}\]
Різні терміни:
\(P(T|D) = 0.99\)
\(P(T|D') = 0.09\)
\(P(D) = 0.02\)
\(P(D') = 0.98\)
Тому,
\[P(D|T)=\frac{(0.99)(0.02)}{(0.99)(0.02)+(0.09)(0.98)}=0.1833\]
яке є тим самим значенням, обчисленим раніше.
