13.6: Проблема Монті Холла
- Page ID
- 99304
Попередні етапи
Постановка проблеми
Проблема Монті Холла включає класичну ситуацію ігрового шоу і названа на честь Монті Холла, давнього ведучого телевізійного ігрового шоу «Давайте зробимо угоду». Є три двері з маркуванням 1, 2 і 3. Автомобіль стоїть за однією з дверей, а кози - за двома іншими:



Правила такі:
- Гравець вибирає двері.
- Господар вибирає іншу двері і відкриває її.
- Ведучий дає гравцеві можливість переходу від її початкового вибору до решти закритих дверей.
- Двері, остаточно вибрані гравцем, відкривається, і вона або виграє, або програє.
Проблема Монті Холла стала предметом інтенсивних суперечок через кілька статей Мерилін Вос Савант у колонці «Запитайте Мерилін» журналу Parade, популярному додатку до недільної газети. Суперечка почалася, коли читач поставив проблему наступним чином:
Припустимо, ви перебуваєте на ігровому шоу, і вам надається вибір з трьох дверей. За одними дверима стоїть машина; за іншими - кози. Ви вибираєте двері—скажіть № 1 - і господар, який знає, що за дверима, відкриває інші двері—скажімо №3 - у якого є коза. Потім він каже вам:Хочеш вибрати двері №2?Це на вашу користь, щоб змінити свій вибір?
Відповідь Мерилін полягала в тому, що учасник повинен переключити двері, стверджуючи, що є\(\frac{1}{3}\) шанс, що автомобіль знаходиться за дверима 1, при цьому є\(\frac{2}{3}\) ймовірність, що машина знаходиться за дверима 2. У двох наступних колонках Мерилін надрукувала ряд відповідей, деякі з науковців, більшість з яких стверджували в гнівних або саркастичних тонах, що вона помилялася і що є рівні шанси, що машина знаходиться за дверима 1 або 2. Мерилін стояла за її оригінальною відповіддю і пропонувала додаткові, але нематематичні, аргументи.
Подумайте про проблему. Чи згодні ви з Мерилін або з її критиками, або ви вважаєте, що жодне рішення не є правильним?
У грі Monty Hall встановіть стратегію господаря на стандарт (значення цієї стратегії буде пояснено нижче). Грайте в гру Monty Hall 50 разів з кожною з наступних стратегій. Ви хочете переглянути свою відповідь на запитання вище?
- Завжди перемикати
- Ніколи не перемикайтеся
У грі Monty Hall встановіть стратегію господаря на сліпу (значення цієї стратегії буде пояснено нижче). Грайте в гру Monty Hall 50 разів з кожною з наступних стратегій. Ви хочете переглянути свою відповідь на запитання вище?
- Завжди перемикати
- Ніколи не перемикайтеся
Моделювання припущень
Коли ми починаємо ретельно думати про проблему Монті Холла, ми розуміємо, що постановка проблеми читачем Мерилін настільки розпливчаста, що змістовна дискусія неможлива без уточнення припущень про стратегії ведучого і гравця. Дійсно, ми побачимо, що непорозуміння щодо цих стратегій є причиною суперечок.
Спробуємо сформулювати задачу математично. Загалом, дії господаря та гравця можуть відрізнятися від гри до гри, але якщо ми маємо провести випадковий експеримент у класичному розумінні, ми повинні припустити, що однакові розподіли ймовірностей керують господарем та гравцем у кожній грі і що ігри незалежні.
Існує чотири основні випадкові величини для гри:
- \(U\): номер дверей, що містять автомобіль.
- \(X\): номер перших дверей, обраних гравцем.
- \(V\): номер дверей, відкритих господарем.
- \(Y\): номер другої двері, обраний гравцем.
Кожна з цих випадкових величин має можливі значення 1, 2 і 3. Однак через правила гри двері, відкриті господарем, не можуть бути жодними з дверей, обраних гравцем, так\(V \ne X\) і\(V \ne Y\). Загалом, ми допустимо можливість того\(V = U\), що господар відкриває двері з автомобілем за ним. Чи є це розумною дією господаря - велика частина суперечок з приводу цієї проблеми.
Експеримент Монті Холла буде повністю визначено математично після того, як буде вказано спільний розподіл базових змінних. Цей спільний розподіл в свою чергу залежить від стратегій господаря і гравця, які ми розглянемо далі.
Стратегії
Стратегії хоста
В експерименті Монті Холла зверніть увагу, що господар визначає функцію щільності ймовірності двері, що містить автомобіль, а саме\(\P(U = i)\) для\(i \in \{1, 2, 3\}\). Очевидним вибором для господаря є випадкове призначення автомобіля на одну з трьох дверей. Це призводить до рівномірного розподілу, і якщо не зазначено інше, ми завжди будемо вважати, що\(U\) має цей розподіл. Таким чином,\(\P(U = i) = \frac{1}{3}\) для\(i \in \{1, 2, 3\}\).
Господар також визначає функцію умовної щільності двері, яку він відкриває, враховуючи знання про двері, що містять автомобіль і перші двері, обрані гравцем, а саме\(\P(V = k \mid U = i, X = j)\) для\(i, \, j \in \{1, 2, 3\}\). Нагадаємо, що оскільки господар не може відкрити двері, обрані гравцем, ця ймовірність повинна бути 0 для\(k = j\).
Таким чином, розподіл\(U\) і умовний розподіл\(V\) даних\(U\) і\(X\) складають стратегію господаря.
Стандартна стратегія
У більшості реальних ігрових шоу господар завжди відкривав двері з козою за нею. Якщо перший вибір гравця неправильний, то господар не має вибору; він не може відкрити двері з автомобілем або вибором гравця і тому повинен відкрити єдину двері, що залишилися. З іншого боку, якщо перший вибір гравця правильний, то господар може відкрити будь-яку з решти дверей, так як кози стоять позаду обох. Таким чином, він може, природно, вибрати одну з цих дверей випадковим чином.
Ця стратегія призводить до наступного умовного розподілу для\(V\) заданого\(U\) і\(X\):\[ \P(V = k \mid U = i, X = j) = \begin{cases} 1, & i \ne j, \; i \ne k, \; k \ne j \\ \frac{1}{2}, & i = j, \; k \ne i \\ 0, & k = i, \; k = j \end{cases} \]
Цей розподіл, поряд з рівномірним розподілом для\(U\), буде називатися стандартною стратегією для господаря.
У грі Monty Hall встановіть стратегію господаря на стандарт. Грайте в гру 50 разів з кожною з наступних стратегій гравця. Що працює краще?
- Завжди перемикати
- Ніколи не перемикайтеся
Стратегія сліпих
Ще одна можлива стратегія другого етапу полягає в тому, щоб господар завжди відкривав двері, обрані навмання з двох можливостей. Таким чином, господар цілком може відкрити двері, що містять автомобіль.
Ця стратегія призводить до наступного умовного розподілу для\(V\) заданого\(U\) і\(X\):\[ \P(V = k \mid U = i, X = j) = \begin{cases} \frac{1}{2}, & k \ne j \\ 0, & k = j \end{cases} \]
Цей розподіл разом з рівномірним розподілом для\(U\) буде називатися сліпий стратегією для господаря. Сліпа стратегія здається трохи дивною. Однак плутанина між двома стратегіями є джерелом суперечок щодо цієї проблеми.
У грі Monty Hall встановіть стратегію господаря на сліпу. Грайте в гру 50 разів з кожною з наступних стратегій гравця. Що працює краще?
- Завжди перемикати
- Ніколи не перемикайтеся
Стратегії гравця
Гравець, з іншого боку, визначає функцію щільності ймовірності свого першого вибору, а саме\(\P(X = j)\) для\(j \in \{1, 2, 3\}\). Очевидним першим вибором для гравця є випадковий вибір дверей, оскільки гравець не має знань на даний момент. Це призводить до рівномірного розподілу, тому\(\P(X = j) = \frac{1}{3}\) для\(j \in \{1, 2, 3\}\)
Гравець також визначає функцію умовної щільності свого другого вибору, враховуючи знання її першого вибору і двері, що відкриваються господарем, а саме\( \P(Y = l \mid X = j, V = k) \) для\(i, \, j, \, k \in \{1, 2, 3\}\) з\(j \ne k\). Нагадаємо, що оскільки гравець не може вибрати двері, відкриті господарем, ця ймовірність повинна бути 0 для\(l = k\). Розподіл\(X\) і умовний розподіл\(Y\) даних\(X\) і\(V\) складають стратегію гравця.
Припустимо, що гравець перемикається з ймовірністю\(p \in [0, 1]\). Це призводить до наступного умовного розподілу:\[ \P(Y = l \mid X = j, V = k) = \begin{cases} p, & j \ne k, \; j \ne l, \; k \ne l \\ 1 - p, & j \ne k, \; l = j \\ 0, & j = k, \; l = k \end{cases} \]
Зокрема, якщо\(p = 1\), плеєр завжди перемикається, в той час як якщо\(p = 0\), плеєр ніколи не перемикається.
Математичний аналіз
Ми майже готові математично проаналізувати проблему Монті Холла. Але спочатку ми повинні зробити деякі припущення про незалежність, щоб включити відсутність знань, які господар і гравець мають про дії один одного. По-перше, гравець не знає про двері, що містять машину, тому припускаємо, що\(U\) і\(X\) є незалежними. Крім того, єдина інформація про двері автомобіля, яку має гравець, коли вона робить свій другий вибір, - це інформація (якщо така є), виявлена її першим вибором та подальшим вибором господаря. Математично це означає,\(Y\) що умовно не залежить від\(U\) даного\(X\) і\(V\).
Дистрибутиви
Стратегії господаря та гравця формують основні дані для проблеми Монті Холла. Через припущення про незалежність спільне розподіл основних випадкових величин повністю визначається цими стратегіями.
Функція щільності ймовірності суглоба\((U, X, V, Y)\) задається
\[ \P(U = i, X = j, V = k, Y = l) = \P(U = i) \P(X = j) \P(V = k \mid U = i, X = j) \P(Y = l \mid X = j, V = k), \quad i, \; j, \; k, \; l \in \{1, 2, 3\} \]Доказ
Це випливає з припущень незалежності та правила множення умовної ймовірності.
Імовірність будь-якої події, визначеної в терміні завдання Монті Холла, може бути обчислена шляхом підсумовування щільності з'єднання над відповідними значеннями\((i, j, k, l)\).
З будь-якою з основних стратегій хоста,\(V\) рівномірно розподіляється на\(\{1, 2, 3\}\).
Припустимо, що гравець перемикається з ймовірністю\(p\). З будь-якою з основних стратегій хоста,\(Y\) рівномірно розподіляється на\(\{1, 2, 3\}\).
В експерименті Монті Холл встановіть стратегію господаря на стандарт. Для кожного з наступних значень\(p\), виконайте моделювання 1000 разів. На основі відносної частоти, яка стратегія працює найкраще?
- \(p = 0\)(ніколи не перемикайтеся)
- \(p = 0.3\)
- \(p = 0.5\)
- \(p = 0.7\)
- \(p = 1\)(завжди перемикається)
В експерименті Монті Холл встановіть стратегію господаря на сліпу. Для кожного з наступних значень\(p\), запустіть експеримент 1000 разів. На основі відносної частоти, яка стратегія працює найкраще?
- \(p = 0\)(ніколи не перемикайтеся)
- \(p = 0.3\)
- \(p = 0.5\)
- \(p = 0.7\)
- \(p = 1\)(завжди перемикається)
Імовірність виграшу
Подія, коли гравець виграє гру, є\(\{Y = U\}\). Ми обчислимо ймовірність цієї події з основними стратегіями господаря та гравця.
Припустимо, що господар дотримується стандартної стратегії і що гравець перемикається з ймовірністю\(p\). Тоді ймовірність того, що гравець виграє, дорівнює\[ \P(Y = U) = \frac{1 + p}{3} \]
Зокрема, якщо гравець завжди перемикається, ймовірність того, що вона виграє, є\(p = \frac{2}{3}\) і якщо гравець ніколи не перемикається, ймовірність того, що вона виграє, є\(p = \frac{1}{3}\).
В експерименті Монті Холл встановіть стратегію господаря на стандарт. Для кожного з наступних значень\(p\), виконайте моделювання 1000 разів. У кожному конкретному випадку порівняйте відносну частоту виграшу з ймовірністю виграшу.
- \(p = 0\)(ніколи не перемикайтеся)
- \(p = 0.3\)
- \(p = 0.5\)
- \(p = 0.7\)
- \(p = 1\)(завжди перемикається)
Припустимо, що господар дотримується сліпої стратегії. Тоді для будь-якої стратегії гравця ймовірність того, що гравець виграє, становить\[ \P(Y = U) = \frac{1}{3} \]
В експерименті Монті Холл встановіть стратегію господаря на сліпу. Для кожного з наступних значень\(p\), запустіть експеримент 1000 разів. У кожному конкретному випадку порівняйте відносну частоту виграшу з ймовірністю виграшу.
- \(p = 0\)(ніколи не перемикайтеся)
- \(p = 0.3\)
- \(p = 0.5\)
- \(p = 0.7\)
- \(p = 1\)(завжди перемикається)
Для повного вирішення проблеми Монті Холла ми хочемо обчислити умовну ймовірність того, що гравець виграє, враховуючи, що господар відкриває двері\[ \P(Y = U \mid V \ne U) = \frac{\P(Y = U)}{\P(V \ne U)} \] з козою за ним: За допомогою основних стратегій господаря та гравця обчислено чисельник, ймовірність виграшу. При цьому потрібно враховувати знаменник, ймовірність того, що господар відкриє двері з козелом. Якщо господар використовує стандартну стратегію, то умовна ймовірність виграшу така ж, як і безумовна ймовірність виграшу, незалежно від стратегії гравця. Зокрема, ми маємо наступний результат:
Якщо господар дотримується стандартної стратегії і гравець перемикається з ймовірністю\(p\), то\[ \P(Y = U \mid V \ne U) = \frac{1 + p}{3} \]
Доказ
Це випливає з ймовірності виграшу вище.
Знову ж таки, ймовірність збільшується від того\( p = 0 \),\( \frac{1}{3} \) коли, щоб гравець ніколи не перемикався, до\( \frac{2}{3} \) коли\( p = 1 \), щоб гравець завжди перемикався.
Якщо господар дотримується стратегії сліпих, то для будь-якого гравця стратегії,\(\P(V \ne U) = \frac{2}{3}\) а значить\(\P(Y = U \mid V \ne U) = \frac{1}{2}\).
В експерименті Монті Холл встановіть стратегію господаря на сліпу. Для кожного з наступних значень\(p\), виконайте експеримент 500 разів. У кожному конкретному випадку обчислити умовну відносну частоту виграшу, враховуючи, що господар показує козу, і порівняйте з теоретичною відповіддю вище,
- \(p = 0\)(ніколи не перемикайтеся)
- \(p = 0.3\)
- \(p = 0.5\)
- \(p = 0.7\)
- \(p = 1\)(завжди перемикається)
Плутанина між умовною ймовірністю виграшу для цих двох стратегій стала джерелом багатьох суперечок у проблемі Монті Холла. Мерилін, ймовірно, думала про стандартну стратегію господаря, тоді як деякі її критики думали про сліпу стратегію. Ця проблема вказує на важливість ретельного моделювання, ретельного викладання припущень. Мерилін правильна, якщо господар дотримується стандартної стратегії; критики правильні, якщо господар дотримується стратегії сліпих; будь-яка кількість інших відповідей може бути правильною, якщо господар дотримується інших стратегій.
Математична формулювання, яку ми використовували, досить повна. Однак, якщо ми просто хочемо вирішити проблему Мерилін, існує набагато простіший аналіз (який ви, можливо, виявили самі). Припустимо, що господар дотримується стандартної стратегії, і таким чином завжди відкриває двері з козлом. Якщо перші двері гравця неправильні (містить козла), то господар не має вибору і повинен відкрити інші двері з козою. Потім, якщо гравець перемикається, вона виграє. З іншого боку, якщо перші двері гравця правильні і вона перемикається, то, звичайно, вона програє. Таким чином, ми бачимо, що якщо гравець завжди перемикається, то він виграє, якщо і тільки якщо її перший вибір неправильний, подія, яка, очевидно, має ймовірність\(\frac{2}{3}\). Якщо гравець ніколи не перемикається, то вона виграє тоді і тільки в тому випадку, якщо її перший вибір правильний, подія з ймовірністю\(\frac{1}{3}\).
