8.1.2: Несиметричний двійковий канал
- Page ID
- 30071
Несиметричний двійковий канал - це той, в якому ймовірності помилок для входів 0 і 1 різні, т. Е\(c_{01} \neq c_{10}\). Ми ілюструємо несиметричні бінарні канали з крайнім випадком на основі медичного тесту на хворобу Гентінгтона.

Хвороба Хантінгтона - рідкісне, прогресуюче, спадкове порушення мозку без відомого лікування. Він був названий на честь доктора Джорджа Хантінгтона (1850—1915), лікаря Лонг-Айленда, який опублікував опис у 1872 році. Вона викликана дефектним геном, який був ідентифікований в 1983 році. Мабуть, найвідомішою людиною, ураженим хворобою, був автор пісень Вуді Гатрі.
Біологічна дитина людини, яка носить дефектний ген, має 50% шансів успадкувати дефектний ген. Для популяції в цілому ймовірність перенесення дефектного гена набагато нижче. За даними Американського товариства хвороб Гентінгтона, http://www.hdsa.org, «Більше чверті мільйона американців мають HD або «ризикують» успадкувати хворобу від постраждалого батька». Це близько 1/1000 населення, тому для людини, обраної навмання, з невідомим сімейним анамнезом, розумно оцінити ймовірність перенесення ураженого гена в 1/2000.
Люди, які несуть дефектний ген, врешті-решт розвивають хворобу, якщо вони не вмирають від іншої причини спочатку. Симптоми найчастіше з'являються в середньому віці, у людей в 40 або 50 років, можливо, після того, як вони вже створили сім'ю і тим самим, можливо, передали дефектний ген іншому поколінню. Хоча хвороба не є смертельною, ті, хто перебуває на запущених стадіях, як правило, помирають від його ускладнень. До недавнього часу люди з сімейною історією хвороби стикалися з життям невизначеності, не знаючи, чи переносять вони дефектний ген, і не знаючи, як керувати своїм особистим та професійним життям.
У 1993 році був розроблений тест, який може визначити, якщо ви носите дефектний ген. На жаль, тест не є ідеальним; існує ймовірність помилкового позитиву (повідомлення про те, що у вас є, коли ви насправді цього не зробите) та помилкового негативу (повідомлення про ваш ген не є дефектним, коли він насправді є). Для наших цілей будемо вважати, що тест дає тільки відповідь «так/ні», і що ймовірність хибного позитиву дорівнює 2%, а ймовірність помилкового негативу - 1%. (Справжній тест насправді кращий - він також оцінює тяжкість дефекту, який співвідноситься з віком, в якому починаються симптоми.)
Якщо ви пройдете тест і дізнаєтеся результат, ви, звичайно, хотіли б зробити висновок, чи буде у вас розвиток захворювання в кінцевому підсумку. Прийоми, розроблені вище, можуть допомогти.
Давайте моделюємо тест як дискретний процес без пам'яті, з входом\(A\) (без дефектного гена) і\(B\) (дефектний ген), і виходи\(P\) (позитивний) і\(N\) (негативний). Процес, показаний на малюнку 8.3, не є симетричним двійковим каналом, оскільки дві ймовірності помилок не рівні.
Спочатку розглянемо застосування цього тесту комусь з сімейним анамнезом, для якого\(p(A) = p(B)\) = 0,5. Тоді, якщо тест негативний, ймовірність для цієї людини мати дефект становить 1/99 = 0,0101, а ймовірність його відсутності становить 98/99 = 0,9899. З іншого боку, якщо тест позитивний, ймовірність для цієї людини носити дефектний ген становить 99/101 = 0,9802 і ймовірність цього не зробити 2/101 = 0,0198. Тест дуже ефективний, оскільки два виходи мають на увазі, з великою ймовірністю, різні входи.
Цікаве питання, яке піднімається існуванням цього тесту, але не розглядається нашою математичною моделлю, полягає в тому, чи обирає людина з сімейною історією пройти тест, чи він чи вона вважає за краще жити, не знаючи, що чекає майбутнє. Розробка тесту фінансувалася групою, включаючи вдову Гатрі та очолювала чоловік на ім'я Мілтон Векслер (1908—2007), який був стурбований своїми дочками, оскільки його дружина та її брати всі мали хворобу. Дочки Векслер, становище яких надихнуло на розвиток тесту, вирішили не брати його.
Далі розглянемо застосування цього тесту комусь з невідомою сімейною історією, так що\(p(A)\) = 0,9995 і\(p(B)\) = 0,0005. Тоді, якщо тест негативний, ймовірність того, що людина несе дефектний ген\(p(B \;|\; N)\), становить
\[\dfrac{0.0005 \times 0.01}{0.0005 \times 0.01+0.9995 \times 0.98}=0.000005105 \tag{8.9} \]
і ймовірність того, що людина несе\(p(A \;|\; N)\) нормальний ген
\[\dfrac{0.9995 \times 0.98}{0.0005 \times 0.01+0.9995 \times 0.98}=0.999994895 \tag{8.10} \]
З іншого боку, якщо тест позитивний, ймовірність того, що ця людина несе дефектний ген,\(p(B \;|\; P)\) є
\[\dfrac{0.0005 \times 0.99}{0.0005 \times 0.99+0.9995 \times 0.02}= 0.02416 \tag{8.11} \]
і ймовірність того, що\(p(A \;|\; P)\) дефект не має
\[\dfrac{0.9995 \times 0.02}{0.0005 \times 0.99+0.9995 \times 0.02}= 0.97584 \tag{8.12} \]
Тест, здається, не розрізняє два можливі входи, оскільки переважна ймовірність полягає в тому, що людина має нормальний ген, незалежно від результатів тесту. Іншими словами, якщо ви отримуєте позитивний результат тесту, це, швидше за все, було викликано помилкою тестування, ніж дефектним геном. Здається, не існує корисної мети, яку обслуговує тестування людей без сімейного анамнезу. (Звичайно, повторні тести можна зробити, щоб зменшити помилково позитивний показник.)
Інформаційний аналіз чітко показує різницю між цими двома випадками. По-перше, нагадаємо, що ймовірності суб'єктивні, або залежні від спостерігача. Лабораторний технік, який виконує тест, імовірно, не знає, чи є сімейний анамнез, і тому не зможе нічого зробити висновок з результатів. Тільки той, хто знає сімейну історію, міг зробити корисний висновок. По-друге, повчально обчислити інформаційний потік в двох випадках. Нагадаємо, що всі п'ять інформаційних заходів (\(I, L, M, N\), і\(J\)) залежать від вхідних ймовірностей. Простий розрахунок двох випадків призводить до інформаційних величин (у бітах) у таблиці 8.1 (зверніть увагу, наскільки більше\(N\), ніж\(M\) якщо немає відомої сімейної історії).
| \(p(A)\) | \(p(B)\) | \(I\) | \(L\) | \(M\) | \(N\) | \(J\) | |
|---|---|---|---|---|---|---|---|
| Сімейний анамнез | \ (p (A)\) ">0.5 | \ (p (B)\) ">0.5 | \ (I\) ">1.00000 | \ (Л\) ">0.11119 | \ (М\) ">0.88881 | \ (N\) ">0.11112 | \ (J\) ">0,99993 |
| Невідомий Сімейний анамнез | \ (p (A)\) ">0,9995 | \ (p (B)\) ">0,0005 | \ (I\) ">0,00620 | \ (Л\) ">0,00346 | \ (М\) ">0.00274 | \ (N\) ">0,14141 | \ (J\) ">0,1416 |
Чітко тест передає інформацію про стан пацієнтів, зменшуючи невизначеність у випадку, коли є сімейний анамнез захворювання. З іншого боку, без сімейної історії дуже мало інформації, яку можна було б передати, оскільки так мало початкової невизначеності.
