13.8: Червона і чорна гра
- Page ID
- 99296
У цьому розділі та наступних трьох розділах ми вивчимо стратегії азартних ігор для однієї з найпростіших моделей азартних ігор. Однак, незважаючи на простоту моделі, математичний аналіз призводить до деяких красивих, а іноді і дивовижних результатів, які мають важливість і застосування далеко за межами азартних ігор. Наша експозиція базується насамперед на класичній книзі Даббінса і Дикуна «Нерівності для стохастичних процесів» («Як грати в азартні ігри, якщо потрібно)» Лестера Е Даббінса та Леонарда Дж. Севіджа (1965).
Основна теорія
припущення
Ось основна ситуація: Гемблер починає з початкової суми грошей. Вона робить ставку на незалежні, імовірно однакові ігри, кожна з яких має два результати - виграш або програш. Якщо вона виграє гру, вона отримує суму ставки на цю гру; якщо вона програє гру, вона повинна сплатити суму ставки. Таким чином, гравець грає на рівних ставках. Ця конкретна ситуація (IID гри і навіть ставки) відома як червоний і чорний, і названа за кольорові ставки в казино гри рулетка. Інші приклади - пас і не пас ставки в кістки.
Спробуємо математично сформулювати гральний експеримент. Спочатку\(I_n\) позначимо результат\(n\) го ігрового за\(n \in \N_+\), де 1 позначає виграш, а 0 позначає програш. Це незалежні індикаторні випадкові величини з\(p \in [0, 1]\) однаковим розподілом:\[ \P\left(I_j = 1\right) = p_j, \quad \P\left(I_j = 0\right) = q = 1 - p_j \] де ймовірність виграшу окремої гри. Таким чином,\(\bs{I} = (I_1, I_2, \ldots)\) являє собою послідовність випробувань Бернуллі.
Якщо\(p = 0\), то гравець завжди програє, а якщо\(p = 1\) тоді гравець завжди виграє. Ці банальні випадки не цікаві, тому ми зазвичай будемо вважати, що\(0 \lt p \lt 1\). У реальних гральних будинках, звичайно,\(p \lt \frac{1}{2}\) (тобто ігри несправедливі по відношенню до гравця), тому нам буде особливо цікава ця справа.
Випадкові процеси
Статок азартного гравця з плином часу є основним випадковим процесом інтересу: Давайте\(X_0\) позначимо початковий стан\(X_i\) азартного гравця і стан гравця після\(i\) ігор. Стратегія азартного гравця складається з рішень про те, скільки робити ставки на різні ігри і коли кинути. Нехай\(Y_i\) позначають суму\(i\) ї ставки, а нехай\(N\) позначають кількість ігор, зіграних азартним гравцем. Якщо ми хочемо, то завжди можемо припустити, що ігри тривають назавжди, але з припущенням, що гравець робить ставку 0 на всі ігри після\(N\). З цим розумінням, результат гри, фортуна та процеси ставок визначаються на всі часи\(i \in \N_+\).
Процес фортуни пов'язаний з процесом парі наступним чином:\[ X_j = X_{j-1} + \left(2 I_j - 1\right) Y_j, \quad j \in \N_+ \]
Стратегії
Стратегія азартного гравця може бути дуже складною. Наприклад, випадкова величина\(Y_n\), ставка азартного гравця на гру\(n\) або подія\(N = n - 1\), її рішення зупинитися після\(n - 1\) ігор, можуть базуватися на всій минулій історії гри, аж до часу\(n\). Технічно ця історія утворює\( \sigma \) алгебру:\[ \mathscr{H}_n = \sigma\left\{X_0, Y_1, I_1, Y_2, I_2, \ldots, Y_{n-1}, I_{n-1}\right\} \] Більше того, вони можуть мати додаткові джерела випадковості. Наприклад, гравець, який грає в рулетку, може частково базувати свої ставки на рулоні щасливого вмирати, який вона тримає в кишені. Однак гравець не може бачити в майбутнє (на жаль з її точки зору), тому можна хоча б припустити, що\(Y_n\) і\(\{N = n - 1\}\) є незалежними\(\left(I_1, I_2, \ldots, I_{n-1}\right)\).
Принаймні з точки зору очікуваної вартості будь-яка гральна стратегія марна, якщо ігри несправедливі.
\(\E\left(X_i\right) = \E\left(X_{i-1}\right) + (2 p - 1) \E\left(Y_i\right)\)для\(i \in \N_+\)
Доказ
Це випливає з попереднього результату і припущення про відсутність передбачення.
Припустимо, що у гемблера є позитивна ймовірність зробити реальну ставку на гру\(i\), так що\(\E(Y_i) \gt 0\). Тоді
- \(\E(X_i) \lt \E(X_{i-1})\)якщо\(p \lt \frac{1}{2}\)
- \(\E(X_i) \gt \E(X_{i-1})\)якщо\(p \gt \frac{1}{2}\)
- \(\E(X_i) = \E(X_{i-1})\)якщо\(p = \frac{1}{2}\)
Доказ
Це випливає з попереднього результату на очікуване значення\( X_i \).
Таким чином, на будь-яку гру, в якій азартний гравець робить позитивну ставку, її очікуваний стан строго зменшується, якщо ігри несправедливі, залишається колишнім, якщо ігри чесні, і строго збільшується, якщо ігри сприятливі.
Як ми вже зазначали раніше, загальна стратегія може залежати від минулої історії і може бути рандомізованою. Однак, оскільки основні ігри Бернуллі є незалежними, можна здогадатися, що ці складні стратегії не кращі, ніж прості стратегії, в яких сума ставки та рішення про зупинку базуються лише на поточному стані гравця. Ці прості стратегії дійсно відіграють фундаментальну роль і називаються стаціонарними, детермінованими стратегіями. Така стратегія може бути описана функцією ставок\(S\) від простору фортун до простору допустимих ставок, так що\(S(x)\) це сума, яку гравець робить ставку, коли її поточний стан\(x\).
Правило зупинки
Відтепер ми будемо вважати, що правило зупинки гравця є дуже простим і стандартним: вона буде робити ставки на ігри, поки вона або не втратить весь свій стан і не буде зруйнований, або досягне фіксованого цільового стану\(a\):\[ N = \min\{n \in \N: X_n = 0 \text{ or } X_n = a\} \] Таким чином, будь-яка стратегія (функція ставок)\(S\) повинна задовольняти\(s(x) \le \min\{x, a - x\}\) для\(0 \le x \le a\): гравець не може робити ставки на те, що у неї немає, і не буде ставити більше, ніж потрібно для досягнення мети\(a\).
Якщо ми хочемо, ми можемо думати про різницю між цільовим станом та початковим станом як про весь стан будинку. При такій інтерпретації гравець і будинок грають симетричні ролі, але з додатковими ймовірностями виграшу: гра триває до тих пір, поки гравець не буде зруйнований, або будинок не буде зруйнований. Наш основний інтерес полягає в остаточному\(X_N\) стані азартного гравця. Зверніть увагу, що ця випадкова величина приймає всього два значення; 0 і\(a\).
Середнє значення і дисперсія кінцевого фортуну задаються
- \(\E(X_N) = a \P(X_N = a)\)
- \(\var(X_N) = a^2 \P(X_N = a) \left[1 - \P(X_N = a)\right]\)
Імовірно, азартний гравець хотів би максимально збільшити ймовірність досягнення цільового стану. Чи краще ставити невеликі суми або великі суми, або це не має значення? Як оптимальна стратегія, якщо така є, залежить від початкового стану, цільового стану та ймовірності виграшу в грі?
Нас також цікавить\(\E(N)\), очікувана кількість зіграних ігор. Можливо, другорядною метою азартного гравця є максимізація очікуваної кількості ігор, які вона отримує, щоб грати. Ці дві цілі сумісні чи несумісні? Тобто, чи може гравець максимізувати як її ймовірність досягнення мети, так і очікувану кількість зіграних ігор, або максимізація однієї кількості обов'язково означає мінімізацію іншого?
У наступних двох розділах ми проаналізуємо та порівняємо дві стратегії, які в певному сенсі протилежні:
- Боязка гра: На кожну гру, поки вона не зупиниться, азартний гравець робить невелику постійну ставку, скажімо, $1.
- Смілива гра: На кожній грі, поки вона не зупиниться, гравець робить ставку або весь свій стан, або суму, необхідну для досягнення цільового стану, залежно від того, що менше.
У заключному розділі глави ми повернемося до питання про оптимальні стратегії.
