Skip to main content
LibreTexts - Ukrayinska

5.2: Шаблони ймовірного висновку

  • Page ID
    98643
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

     

    Деякі закономірності ймовірного висновку

    Нас турбує ймовірність виникнення якогось гіпотезованого стану. Загалом, ми маємо докази для стану, який ніколи не може бути абсолютно впевненим. Ми змушені оцінювати ймовірності (ймовірності) на підставі доказів. Деякі типові приклади:

    Таблиця 5.3.
    ГІПОТЕЗИ ДОКАЗИ
    Успіх роботи Особистісні риси
    Наявність масла Геологічні споруди
    Експлуатація пристрою Фізичний стан
    Стан ринку Тестовий стан ринку
    наявність захворювання Тести на симптоми

    Якщо\(H\) подія існує гіпотетична умова і\(E\) є подією, що відбувається докази, ймовірності, як правило, є\(P(H)\) (або значення шансів)\(P(E|H)\), і. Бажано\(P(H|E)\) або, що еквівалентно, шанси\(P(H|E)/P(H^c|E)\). Ми просто використовуємо правило Байєса, щоб змінити напрямок кондиціонування.

    \(\dfrac{P(H|E)}{P(H^c|E)} = \dfrac{P(E|H)}{P(E|H^c)} \cdot \dfrac{P(H)}{P(H^c)}\)

    Ніякої умовної самостійності в даному випадку не бере участі.

    Незалежні докази гіпотезованого стану

    Припустимо, є два «незалежних» біти доказів. Тепер отримання цих доказів може бути «операційно» незалежним, але якщо обидва пункти стосуються гіпотезованого стану, то вони не можуть бути дійсно незалежними. Прийнята умова зазвичай має форму\(P(E_1|H) = P(E_1|HE_2)\) —якщо\(H\) відбувається, то знання\(E_2\) не впливає на ймовірність\(E_1\). Аналогічно у нас зазвичай є\(P(E_1|H^c) = P(E_1|H^cE_2)\). Таким чином\(\{E_1, E_2\}\) ci\(|H\) і\(\{E_1, E_2\}\) ci\(|H^c\).

    Приклад\(\PageIndex{1}\) Independent medical tests

    Припустимо, лікар вважає шанси 2/1, що у пацієнта є певне захворювання. Вона замовляє два незалежних тесту. Нехай\(H\) буде подія, коли пацієнт має захворювання\(E_2\),\(E_1\) і події тести позитивні. Припустимо, що перший тест має ймовірність 0,1 помилкового позитиву і ймовірність 0,05 помилкового негативу. Другий тест має ймовірності 0,05 і 0,08 хибнопозитивних і хибнонегативних відповідно. Якщо обидва тести позитивні, яка задня ймовірність захворювання у пацієнта?

    Рішення

    Припускаючи\(\{E_1, E_2\}\) ci\(|H\) і ci\(|H^c\), ми працюємо спочатку з точки зору коефіцієнтів, а потім перетворюємо на ймовірність.

    \(\dfrac{P(H|E_1 E_2)}{P(H^c|E_1 E_2)} = \dfrac{P(H)}{P(H^c)} \cdot \dfrac{P(E_1E_2|H)}{P(E_1E_2|H^c)} = \dfrac{P(H)}{P(H^c)} \cdot \dfrac{P(E_1|H) P(E_2|H)}{P(E_1|H^c) P(E_2|H^c)}\)

    Дані є

    \(P(H)/P(H^c) = 2\),\(P(E_1|H) = 0.95\),\(P(E_1|H^c) = 0.1\),\(P(E_2|H) = 0.92\),\(P(E_2|H^c) = 0.05\)

    Підставляючи значення, отримуємо

    \(\dfrac{P(H|E_1E_2)}{P(H^c|E_1E_2} = 2 \cdot \dfrac{0.95 \cdot 0.92}{0.10 \cdot 0.05} = \dfrac{1748}{5}\)так що\(P(H|E_1E_2) = \dfrac{1748}{1753} = 1 - \dfrac{5}{1753} = 1 - 0.0029\)

    Докази для симптому

    Іноді докази, які розглядаються, не є доказом гіпотезованого стану, а для деякого стану, який стохастично пов'язаний. Для цілей викладу ми називаємо це посередницьке умова як симптом. Розглянемо ще раз приклади вище.

    Таблиця 5.4.
    ГІПОТЕЗИ СИМПТОМ ДОКАЗИ
    Успіх роботи Особистісні риси Результати діагностичних тестів
    Наявність масла Геологічні споруди Результати геофізичних досліджень
    Експлуатація пристрою Фізичний стан Моніторинговий звіт
    Стан ринку Тестовий стан ринку Результат дослідження ринку
    наявність захворювання Фізичний симптом Тест на симптом

    Ми дозволяємо\(S\) бути подією симптом присутній. Звичайний випадок полягає в тому, що докази безпосередньо пов'язані з симптомом, а не гіпотезованим станом. Результати діагностичного тесту можуть сказати щось про особисті риси заявника, але не можуть мати справу безпосередньо з гіпотезованим станом. Результати тестування будуть однаковими, чи є кандидат успішним у роботі (він чи вона ще не має роботи). Геофізична зйомка займається певними конструктивними особливостями під поверхнею. Якщо несправність або соляний купол присутній, геофізичні результати однакові, незалежно від наявності нафти чи ні. Звіт про фізичний моніторинг стосується певних фізичних характеристик. Його читання однакове, чи вийде пристрій з ладу чи ні. Опитування ринку розглядає лише стан на тестовому ринку. Результати залежать від тестового ринку, а не від національного ринку. Аналіз крові може бути для певних фізичних станів, які часто пов'язані (принаймні статистично) із захворюванням. Але на результат аналізу крові на фізичний стан безпосередньо не впливає наявність або відсутність захворювання.

    В умовах такого типу ми можемо припустити

    \(P(E|SH) = P(E|SH^c)\)і\(P(E|S^cH) = P(E|S^cH^c)\)

    Вони мають на увазі\(\{E, H\}\) ci\(|S\) і ci\(|S^c\). Зараз

    \(\dfrac{P(H|E)}{P(H^c|E)} = \dfrac{P(HE)}{P(H^cE)} = \dfrac{P(HES) + P(HES^c)}{P(H^cES) + P(H^c E S^c)} = \dfrac{P(HS) P(E|HS) + P(HS^c) P(E|HS^c)}{P(H^cS)P(E|H^cS) + P(H^cS^c) P(E|H^cS^c)}\)

    \(=\dfrac{P(HS) P(E|S) P(HS^c) P(E|S^c)}{P(H^cS) P(E|S) + P(H^cS^c) P(E|S^c)}\)

    Варто відзначити, що кожен член в знаменнику відрізняється від відповідного терміну в чисельнику\(H^c\) наявністю замість\(H\). Перш ніж завершити аналіз, необхідно розглянути, як\(H\) і\(S\) пов'язані стохастично в даних. Можуть розглядатися чотири випадки.

     
    Дані є\(P(S|H)\)\(P(S|H^c)\), і\(P(H)\).
    Дані є\(P(S|H)\)\(P(S|H^c)\), і\(P(S)\).
    Дані є\(P(H|S)\)\(P(H|S^c)\), і\(P(S)\).
    Дані є\(P(H|S)\)\(P(H|S^c)\), і\(P(H)\).
     
    Випадок а:
     
    \ dfrac {P (H|S)} {P (H^c|s)} =\ dfrac {Р (Н) Р (С|Н) П (Е|С) + Р (S^c|h) Р (Е|S ^ c)} {Р (H ^ c) P (H^c) Р (Е|С) + П (H^c) Р (S^c|H^c) Р (Е|С^С)}\)
     

    Приклад\(\PageIndex{2}\) Geophysical survey

    Нехай\(H\) буде подія успішної нафтової свердловини,\(S\) будь подія є геофізична структура, сприятлива до присутності нафти, і\(E\) бути подією геофізична зйомка вказує на сприятливу структуру. Ми припускаємо\(\{H, E\}\) ci\(|S\) і ci\(|S^c\). Дані є

    \(P(H)/P(H^c) = 3\),\(P(S|H) = 0.92\),\(P(S|H^c) = 0.20\),\(P(E|S) = 0.95\),\(P(E|S^c) = 0.15\)

    Тоді

    \(\dfrac{P(H|E)}{P(H^c|E)} = 3 \cdot \dfrac{0.92 \cdot 0.95 + 0.08 \cdot 0.15}{0.20 \cdot 0.95 + 0.80 \cdot 0.15} = \dfrac{1329}{155} = 8.5742\)

    щоб\(P(H|E) = 1 - \dfrac{155}{1484}= 0.8956\)

    Геофізичний результат перемістив попередні шанси 3/1 до задніх шансів 8,6/1, з відповідною зміною ймовірностей від 0,75 до 0,90.

     
    Випадок b: Дані є\(P(S)\)\(P(S|H)\)\(P(S|H^c)\),,\(P(E|S)\), і\(P(E|S^c)\). Якщо ми можемо визначити\(P(H)\), ми можемо діяти як у випадку а. тепер за законом повної ймовірності

    \(P(S) = P(S|H) P(H) + P(S|H^c)[1 - P(H)]\)

    які можуть бути вирішені алгебраїчно, щоб дати

    \(P(H) = \dfrac{P(S) - P(S|H^c)}{P(S|H) - P(S|H^c)}\)

    Приклад\(\PageIndex{3}\) Geophysical survey revisited

    У багатьох випадках краща оцінка\(P(S)\) або шанси\(P(S)/P(S^c)\) можуть бути зроблені на основі попередніх геофізичних даних. Припустимо, що попередні\(S\) коефіцієнти для 3/1, так що\(P(S) = 0.75\). Використовуючи інші дані в прикладі, ми маємо

    \(P(H) = \dfrac{P(S) - P(S|H^c)}{P(S|H) - P(S|H^c)} = \dfrac{0.75-0.20}{0.92-0.20} = 55/72\), щоб\(\dfrac{\(P(H)}{P(H^c)} = 55/17\)

    Використовуючи шаблон випадку а, ми маємо

    \(\dfrac{P(H|E)}{P(H^c|E)} = \dfrac{55}{17} \cdot \dfrac{0.92 \cdot 0.95 + 0.08 \cdot 0.15}{0.20 \cdot 0.95 + 0.80 \cdot 0.15} = \dfrac{4873}{527} = 9.2467\)

    щоб\(P(H|E) = 1 - \dfrac{527}{5400} = 0.9024\)

    Зазвичай дані, що стосуються результатів тесту з симптомом, мають форму\(P(E|S)\) і\(P(E|S^c)\), або еквівалент. Дані, що стосуються симптому та гіпотезованого стану, можуть піти будь-яким шляхом. У випадках a і b дані мають форму\(P(S|H)\) і\(P(S|H^c)\), або еквівалент, отримані з даних, що показують частку разів симптом відзначається при виявленні гіпотезованого стану. Але ці дані можуть йти в зворотному напрямку, поступаючись\(P(H|S)\) і\(P(H|S^c)\), або еквівалентно. Така ситуація у випадках c і d.

    Дані c: Дані є\(P(E|S)\),\(P(E|S^c)\),\(P(H|S)\),\(P(H|S^c)\) і\(P(S)\).

    Приклад\(\PageIndex{4}\) Evidence for a disease symptom with prior P(S)

    Коли спостерігається певний кров'яний синдром, дане захворювання вказується в 93 відсотках часу. Захворювання виявляється без цього синдрому лише три відсотки часу. Тест на синдром має ймовірність 0,03 помилкового позитиву і 0,05 помилкового негативу. Попереднє обстеження вказує на ймовірність 0,30 того, що у пацієнта є синдром. Проводиться тест, результат негативний. Яка ймовірність захворювання у пацієнта?

    Рішення

    З точки зору позначення вище, дані

    \(P(S) = 0.30\),\(P(E|S^c) = 0.03\),\(P(E^c|S) = 0.05\)

    \(P(H|S) = 0.93\), і\(P(H|S^c) = 0.03\)

    Ми припускаємо\(\{H, E\}\) ci\(|S\) і ci\(|S^c\).

    \(\dfrac{P(H|E^c)}{P(H^c|E^c)} = \dfrac{P(S) P(H|S) P(E^c|S) + P(S^c) P(H|S^c) P(E^c|S^c)}{P(S) P(H^c|S) P(E^c|s) + P(S^c)P(H^c|S^c) P(E^c|S^c)}\)

    \(=\dfrac{0.30 \cdot 0.93 \cdot 0.05 + 0.07 \cdot 0.03 \cdot 0.97}{0.30 \cdot 0.07 \cdot 0.05 + 0.70 \cdot 0.97 \cdot 0.97} = \dfrac{429}{8246}\)

    що має на увазі\(P(H|E^c) = 429/8675 \approx 0.05\)

    Випадок d: Це відрізняється від випадку c лише тим, що\(H\) передбачається попередня ймовірність для. У цьому випадку визначаємо відповідну ймовірність для\(S\) по

    \(P(S) = \dfrac{P(H) - P(H|S^c)}{P(H|S) - P(H|S^c)}\)

    і використовувати шаблон випадку c.

    Приклад\(\PageIndex{5}\) Evidence for a disease symptom with prior P(h)

    Припустимо, для пацієнта в прикладі лікар оцінює шанси на наявність захворювання 1/3, так що\(P(H) = 0.25\). Знову ж таки, результат тесту негативний. Визначте задні коефіцієнти, наведені\(E^c\).

    Рішення

    Спочатку визначаємося

    \(P(S) = \dfrac{P(H) - P(H|S^c)}{P(H|S) - P(H|S^c)} = \dfrac{0.25 - 0.03}{0.93 - 0.03} = 11/45\)

    Тоді

    \(\dfrac{P(H|E^c)}{P(H^c|E^c)} = \dfrac{(11/45) \cdot 0.93 \cdot 0.05 + (34/45) \cdot 0.03 \cdot 0.97}{(11/45) \cdot 0.07 \cdot 0.05 + (34/45) \cdot 0.97 \cdot 0.97} = \dfrac{15009}{320291} = 0.047\)

    Результат тесту падає попередні шанси від 1/3 до приблизно 1/21.

    Незалежні докази симптому

    У попередніх випадках ми розглядаємо лише один пункт показань для симптому. Але може бути бажано мати «другу думку». Ми припускаємо, що тести призначені для симптому і не пов'язані безпосередньо з гіпотетичним станом. Якщо тести є операційно незалежними, ми можемо обґрунтовано припустити

    \(P(E_1|SE_2) = P(E_1 |SE_2^c)\)\(\{E_1, E_2\}\)ci\(|S\)
    \(P(E_1|SH) = P(E_1|SH^c)\)\(\{E_1, H\}\) ci\(|S\)
    \(P(E_2|SH) = P(E_2|SH^c)\)\(\{E_2, H\}\) ci\(|S\)
    \(P(E_1E_2|SH) = P(E_1E_2|SH^c)\)\(\{E_1, E_2, H\}\) ci\(|S\)

    Це має на увазі\(\{E_1, E_2, H\}\) ci\(|S\). Аналогічна умова тримає і для\(S^c\). Що стосується одного тесту, то існує чотири випадки, в залежності від краватки між\(S\) і\(H\). Розглянемо приклад «випадок а».

    Приклад\(\PageIndex{6}\) A market survey problem

    Продовольча компанія планує продати на національному рівні нову кашу для сніданку. Його керівники впевнені, що шанси принаймні 3 до 1 продукт буде успішним. Перед запуском нового продукту компанія вирішує дослідити тестовий ринок. Попередній досвід свідчить про те, що надійність тестового ринку така, що якщо національний ринок сприятливий, існує ймовірність 0,9, що тестовий ринок також є. З іншого боку, якщо національний ринок несприятливий, є ймовірність лише 0,2, що тестовий ринок буде сприятливим. Ці факти призводять до наступного аналізу. Нехай

    \(H\)бути подією національний ринок сприятливий (гіпотеза)

    \(S\)бути подією тестовий ринок сприятливий (симптом)

    Вихідними даними є наступні ймовірності, засновані на минулому досвіді:

    • (a) Попередні коефіцієнти:\(P(H)/P(H^c) = 3\)
    • (b) Надійність ринку випробувань:\(P(S|H) = 0.9\)\(P(S|H^c) = 0.2\)

    Якби було відомо, що тестовий ринок сприятливий, ми повинні мати

    \(\dfrac{P(H|S)}{P(H^c|S)} = \dfrac{P(S|H) P(H)}{P(S|H^c)P(H^c)} = \dfrac{0.9}{0.2} \cdot 3 = 13.5\)

    На жаль, неможливо з упевненістю дізнатися стан тестового ринку. Компанія, що приймає рішення, залучають дві компанії з обстеження ринку, щоб зробити незалежні опитування ринку випробувань. Надійність компаній може виражатися наступним чином. Нехай

    \(E_1\)бути подією перша компанія повідомляє про сприятливий тестовий ринок.
    \(E_2\)бути подією друга компанія повідомляє про сприятливий тестовий ринок.

    На підставі попереднього досвіду достовірність доказів про тестовому ринку (симптом) виражається в наступних умовних ймовірностях.

    \(P(E_1|S) = 0.9\)\(P(E_1|S^c) = 0.3\)\(P(E_2|S) = 0.8\)\(B(E_2|S^c) = 0.2\)

    Обидві опитувальні компанії повідомляють, що тестовий ринок сприятливий. Яка ймовірність того, що національний ринок сприятливий, враховуючи цей результат?

    Рішення

    Дві опитувальні фірми працюють «операційно незалежним» способом. Звіт будь-якої компанії не впливає на роботу іншої. Крім того, на кожен звіт впливає лише стан тестового ринку - незалежно від того, яким може бути національний ринок. Згідно з обговоренням вище, ми повинні бути в змозі припустити

    \(\{E_1, E_2, H\}\)ci\(|S\) і\(\{E_1, E_2, H\}\) ci\(S^c\)

    Ми можемо використовувати шаблон, подібний до того, що в прикладі 2, наступним чином:

    \(\dfrasc{P(H|E_1 E_2)}{P(H^c |E_1 E_2)} = \dfrac{P(H)}{P(H^c)} \cdot \dfrac{P(S|H) P(E_1|S)P(E_2|S) + P(S^c|H) P(E_1|S^c) P(E_2|S^2)}{P(S|H^c) P(E_1|S) P(E_2|S) + P(S^c|H^c) P(E_1|S^c) P(E_2|S^c)}\)

    \(= 3 \cdot \dfrac{0.9 \cdot 0.9 \cdot 0.8 + 0.1 \cdot 0.3 \cdot 0.2}{0.2 \cdot 0.9 \cdot 0.8 + 0.8 \cdot 0.3 \cdot 0.2} = \dfrac{327}{32} \approx 10.22\)

    з точки зору задньої ймовірності, ми маємо

    \(P(H|E_1E_2) = \dfrac{327/32}{1 + 327/32} = \dfrac{327}{359} = 1 - \dfrac{32}{359} \approx 0.91\)

    Ми зауважимо, що шанси на користь\(H\), враховуючи позитивні свідчення обох компаній обстеження, становить 10.2 порівняно з шансами, що сприяють H, враховуючи сприятливий тестовий ринок, 13.5. Різниця відображає залишкову невизначеність щодо тестового ринку після ринкових опитувань. Тим не менш, результати ринкових опитувань збільшують шанси на задовільний ринок від попередніх 3 до 1 до заднього 10.2 до 1. З точки зору ймовірностей, опитування ринку збільшують ймовірність сприятливого ринку від оригіналу\(P(H) =0.75\) до заднього\(P(H|E_1 E_2)\). Умовна незалежність результатів опитування робить можливим безпосереднє використання даних.

    Проблема класифікації

    Популяція складається з членів двох підгруп. Бажано сформулювати купу питань, щоб допомогти у виявленні підкласової приналежності випадково відібраних осіб у популяції. Питання розроблені так, щоб для кожної людини відповіді були незалежними, в тому сенсі, що відповіді на будь-яку підмножину цих питань не впливають і не впливають на відповіді на будь-яку іншу підмножину питань. Відповіді, однак, впливають на членство в підгрупі. Таким чином, наше лікування умовної самостійності говорить про те, що доцільно припустити, що відповіді умовно незалежні, враховуючи приналежність до підгрупи. Розглянемо наступний числовий приклад.

    Приклад\(\PageIndex{7}\) A classification problem

    Вибірка з 125 суб'єктів взята з популяції, яка має дві підгрупи. Відомо підгрупове приналежність кожного суб'єкта у вибірці. Кожній людині задають батарею з десяти питань, покликаних бути незалежними, в тому сенсі, що відповідь на будь-який інший не впливає. Суб'єкти відповідають самостійно. Дані про результати зведені в наступну таблицю:

    Таблиця 5.5.
    ГРУПА 1 (69 учасників) ГРУПА 2 (56 учасників)
    Q Так Ні Унц. Так Ні Унц.
    1 42 22 5 20 31 5
    2 34 27 8 16 37 3
    3 15 45 9 33 19 4
    4 19 44 6 31 18 7
    5 22 43 4 23 28 5
    6 41 13 15 14 37 5
    7 9 52 8 31 17 8
    8 40 26 3 13 38 5
    9 48 12 9 27 24 5
    10 20 37 12 35 16 5

    Припустимо, що дані представляють загальну сукупність, що складається з цих двох груп, так що дані можуть бути використані для обчислення ймовірностей та умовних ймовірностей.

    Опитуються кілька осіб. Результатом кожного співбесіди є «профіль» відповідей на питання. Мета - класифікувати людину в одну з двох підгруп на основі профілю відповідей.

    Були взяті наступні профілі.

    • У, Н, У, Н, У, П, У, У, У, Й. У
    • Н, Н, У, Н, У, У, У, П, Н, У
    • У, У, Н, У, У, У, Н, Н, У, У

    Класифікуйте кожного індивіда в одну з підгруп.

    Рішення

    Нехай\(G_1 =\) подія, яку вибрано особа, належить до групи 1, а\(G_2 = G_1^c = \) подія, яку вибрана особа, - з групи 2. Нехай

    \(A_i\)= подія відповідь\(i\) на питання «Так»

    \(B_i\)= подія відповідь\(i\) на питання «Ні»

    \(C_i\)= подія відповідь на\(i\) питання «Невизначено»

    Дані приймаються за\(P(A_1|G_1) = 42/69\) значення і\(P(B_3|G_2) = 19/56\) т.д. профіль

    Y, N, Y, N, Y, U, N, U, Y.U відповідає події\(E = A_1 B_2 A_3 B_4 A_5 C_6 B_7 C_8 A_9 C_{10}\)

    Ми використовуємо форму співвідношення правила Байєса для обчислення задніх коефіцієнтів.

    \(\dfrac{P(G_1|E)}{P(G_2|E)} = \dfrac{P(E|G_1)}{P(E|G_2)} \cdot \dfrac{P(G_1)}{P(G_2)}\)

    Якщо співвідношення більше одиниці, класифікуйте в групу 1; інакше класифікуємо в групу 2 (припускаємо, що співвідношення рівно одиниці настільки малоймовірне, що ми можемо нехтувати ним). Через умовної незалежності ми здатні визначити умовні ймовірності

    \(P(E|G_1) = \dfrac{42 \cdot 27 \cdot 15 \cdot 44 \cdot 22 \cdot 15 \cdot 52 \cdot 3 \cdot 48 \cdot 12}{69^{10}}\)і

    \(P(E|G_2) = \dfrac{29 \cdot 37 \cdot 33 \cdot 18 \cdot 23 \cdot 5 \cdot 17 \cdot 5 \cdot 24 \cdot 5}{56^{10}}\)

    Шанси\(P(G_2)/P(G_2) = 69/56\). Ми знаходимо задні шанси бути

    \(\dfrac{P(G_1 |E)}{P(G_2|E)} = \dfrac{42 \cdot 27 \cdot 15 \cdot 44 \cdot 22 \cdot 15 \cdot 52 \cdot 3 \cdot 48 \cdot 12}{29 \cdot 37 \cdot 33 \cdot 18 \cdot 23 \cdot 5 \cdot 17 \cdot 5 \cdot 24 \cdot 5} \cdot \dfrac{56^9}{69^9} = 5.85\)

    Коефіцієнт\(56^{9} /69^{9}\) походить від\(56^{10}/69^{10}\) множення на коефіцієнти\(P(G_1)/P(G_2) = 69/56\). Оскільки отримані задні шанси, що сприяють групі 1, більше одиниці, ми класифікуємо респондента до групи 1.

    Хоча розрахунки прості і зрозумілі, вони стомлюючі і схильні до помилок. Щоб зробити можливим швидке і легке рішення, скажімо, в ситуації, коли йдуть послідовні співбесіди, у нас є кілька m-процедур для виконання розрахунків. Відповіді на питання зазвичай позначаються деякими такими позначеннями, як Y для так, N для ні, і U для невизначеного. Для того щоб m-процедура працювала, ці відповіді повинні бути представлені числами, що позначають відповідні стовпці в матрицях A і B. Таким чином, в розглянутому прикладі кожен Y повинен бути переведений в 1, кожен N в a 2, а кожен U - в 3. Завдання не особливо складне, але набагато простіше мати MATLAB як переклад, так і зробити розрахунки. Наступний двоетапний підхід для вирішення проблеми працює добре.

    Перша m-процедура oddsdf налаштовує інформацію про частоту. Наступна m-процедура коефіцієнти обчислює коефіцієнти для даного профілю. Перевага розбиття на дві m-процедури полягає в тому, що ми можемо налаштувати дані один раз, а потім повторно викликати розрахунки для різних профілів. Як завжди, необхідно мати дані у відповідній формі. Нижче наведено приклад, в якому дані вводяться з точки зору фактичних частот відгуку.

    % file oddsf4.m
    % Frequency data for classification
    A = [42 22 5; 34 27 8; 15 45 9; 19 44 6; 22 43 4;
         41 13 15; 9 52 8; 40 26 3; 48 12 9; 20 37 12];
    B = [20 31 5; 16 37 3; 33 19 4; 31 18 7; 23 28 5;
         14 37 5; 31 17 8; 13 38 5; 27 24 5; 35 16 5];
    disp('Call for oddsdf')
    

    Приклад\(\PageIndex{8}\) Classification using frequency data

    oddsf4              % Call for data in file oddsf4.m
    Call for oddsdf     % Prompt built into data file
    oddsdf              % Call for m-procedure oddsdf
    Enter matrix A of frequencies for calibration group 1  A
    Enter matrix B of frequencies for calibration group 2  B
    Number of questions = 10
    Answers per question = 3
     Enter code for answers and call for procedure "odds"
    y = 1;              % Use of lower case for easier writing
    n = 2;
    u = 3;
    odds                % Call for calculating procedure
    Enter profile matrix E  [y n y n y u n u y u]   % First profile
    Odds favoring Group 1:   5.845
    Classify in Group 1
    odds                % Second call for calculating procedure
    Enter profile matrix E  [n n u n y y u n n y]   % Second profile
    Odds favoring Group 1:   0.2383
    Classify in Group 2
    odds                % Third call for calculating procedure
    Enter profile matrix E  [y y n y u u n n y y]   % Third profile
    Odds favoring Group 1:   5.05
    Classify in Group 1
    

    Принциповою особливістю коефіцієнтів m-процедури є схема вибору чисел з\(B\) матриць\(A\) і. Якщо\(E\) = [\(yynyuunnyy\)], то кодування переводить це в дійсну числову матрицю

    [1 1 2 1 3 3 2 2 1] використовується внутрішньо. Потім\(A(:, E)\) йде матриця зі стовпцями, відповідними елементам\(E\). Таким чином

    e = A(:,E)
    e =   42    42    22    42     5     5    22    22    42    42
          34    34    27    34     8     8    27    27    34    34
          15    15    45    15     9     9    45    45    15    15
          19    19    44    19     6     6    44    44    19    19
          22    22    43    22     4     4    43    43    22    22
          41    41    13    41    15    15    13    13    41    41
           9     9    52     9     8     8    52    52     9     9
          40    40    26    40     3     3    26    26    40    40
          48    48    12    48     9     9    12    12    48    48
          20    20    37    20    12    12    37    37    20    20
    

    Запис на\(i\) 5-й колонці - це підрахунок, відповідний відповіді\(i\) на питання.\(i\) Наприклад, відповідь на третє питання - N (no), а відповідний підрахунок - третій запис у N (другому) стовпці\(A\). Елемент на діагоналі в третьому стовпці\(A(:, E)\) є третім елементом у цьому стовпці, а отже, і бажаним третім записом стовпця N. Підібравши елементи по діагоналі командою diag (A (:, E)), маємо потрібний набір відліків, відповідних профілю. Те ж саме справедливо і для діаг (B (:, E)).

    Іноді дані наводяться з точки зору умовних ймовірностей і ймовірностей. Незначна модифікація процедури обробляє цей випадок. Для порівняння ми перетводимо наведену вище задачу в цю форму шляхом перетворення лічильників в матрицях\(A\) і\(B\) в умовні ймовірності. Робимо це шляхом ділення на загальний підрахунок в кожній групі (69 і 56 в даному випадку). Також,\(P(G_1) = 69/125 = 0.552\) і\(P(G_2) = 56/125 = 0.448\).

    Таблиця 5.6.
    ГРУПА 1\(P(G_1) = 69/125\) ГРУПА 2\(P(G_2) = 56/125\)
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливе; ">Q Так Ні Унц. \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">Так Ні Унц.
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">1 0.6087 0,3188 0.0725 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.3571 0,5536 0.0893
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">2 0,4928 0,3913 0.1159 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.2857 0.6607 0.0536
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">3 0,2174 0,6522 0.1304 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.5893 0,3393 0.0714
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">4 0,2754 0.6376 0.0870 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.5536 0,3214 0,1250
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">5 0,3188 0.6232 0.0580 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.4107 0.5000 0.0893
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">6 0.5942 0,1884 0,2174 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.2500 0.6607 0.0893
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">7 0.1304 0,7536 0,1160 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.5536 0,3036 0,1428
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">8 0,5797 0,3768 0.0435 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.2321 0.6786 0.0893
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">9 0.6957 0,1739 0.1304 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордон топа:0! важливо; кордон праворуч: 1px твердий; кордону знизу: 1px твердий; вирівнювання тексту: ліворуч! важливо; ">0.4821 0,4286 0.0893
    \ (P (G_1) = 69/125\)» style="межа ліворуч: 0! важливо; кордону топа:0! важливо; кордон правої: 1px твердий; кордону знизу: 0! важливо; вирівнювання тексту: ліворуч! важливо; ">10 0,2899 0.5362 0,1739 \ (P (G_2) = 56/125\)» style="межа ліворуч: 0! важливо; кордону топа:0! важливо; кордон правої: 1px твердий; кордону знизу: 0! важливо; вирівнювання тексту: ліворуч! важливо; ">0.6250 0,2857 0.0893

    Ці дані знаходяться в m-файлі oddsp4.m. Модифікована установка m-процедура oddsdp використовує умовні ймовірності, а потім вимагає шансів m-процедури.

    Приклад\(\PageIndex{9}\) Calculation using conditional probability data

    oddsp4                 % Call for converted data (probabilities)
    oddsdp                 % Setup m-procedure for probabilities
    Enter conditional probabilities for Group 1  A
    Enter conditional probabilities for Group 2  B
    Probability p1 individual is from Group 1  0.552
     Number of questions = 10
     Answers per question = 3
     Enter code for answers and call for procedure "odds"
    y = 1;
    n = 2;
    u = 3;
    odds
    Enter profile matrix E  [y n y n y u n u y u]
    Odds favoring Group 1:  5.845
    Classify in Group 1
    

    Незначну невідповідність коефіцієнтів на користь Групи 1 (5.8454 порівняно з 5.8452) можна пояснити округленням умовних ймовірностей до чотирьох місць. Наведена вище презентація округляє результати до 5.845 в кожному випадку, тому невідповідність не очевидна. Це цілком прийнятно, так як невідповідність ніяк не впливає на результати.