Skip to main content
LibreTexts - Ukrayinska

2.1: Вступ до ігор з нульовою сумою двох осіб

  • Page ID
    65742
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    У всіх прикладах з останнього розділу, незалежно від того, що виграв один гравець, інший гравець програв.

    Визначення: Zero-Sum (постійна сума)

    Гра для двох гравців називається грою з нульовою сумою, якщо сума виграшів кожному гравцеві є постійною для всіх можливих результатів гри. Більш конкретно, терміни (або координати) у кожному векторі виграшу повинні складати до одного і того ж значення для кожного вектора виграшу. Такі ігри іноді називають іграми з постійною сумою.

    Ми завжди можемо думати про ігри з нульовою сумою як ігри, в яких виграш одного гравця - це програш іншого гравця.

    Приклад Template:index: Нульова сума в покері

    Розглянемо гру в покер, в якій кожен гравець приходить до гри с\($100\). Якщо гравців п'ять, то сума грошей у всіх п'яти гравців завжди\($500\). У будь-який момент часу під час гри конкретний гравець може мати більше ніж\($100\), але тоді інший гравець повинен мати менше ніж\($100\). Перемога одного гравця - це програш іншого гравця.

    Приклад Template:index: Нульова сума при діленні торта

    Розглянемо гру з поділом тортів. Визначте матрицю виплат для цієї гри. Важливо визначити, які варіанти кожного гравця в першу чергу: як «різак» може розрізати торт? Як «вибирач» може підібрати її шматок? Матриця виплат наведена в табл\(2.1.1\).

    Таблиця 2.1.1: Матриця виплат для гри різання тортів
    вибирач
    Більший шматок Менший шматок
    Різак Вирізати рівномірно (половина, половина) (половина, половина)
    Ріжемо нерівномірно (маленький шматок, великий шматок) (великий шматок, маленький шматок)

    Для того, щоб краще бачити, що ця гра є нульовою сумою (або постійною сумою), ми могли б дати значення для кількості пирога, який отримує кожен гравець. Наприклад, половина пирога буде\(50 \%\), невеликий шматочок може бути\(40 \%\). Тоді ми можемо переписати матрицю з процентними значеннями в табл\(2.1.2\).

    Таблиця 2.1.2: Матриця виплат, у відсотках торта, для гри на різання тортів.
    вибирач
    Більший шматок Менший шматок
    Різак Вирізати рівномірно \((50, 50)\) \((50, 50)\)
    Вирізати рівномірно \((40, 60)\) \((60, 40)\)

    У кожному результаті виграші кожному гравцеві складаються до\(100\) (або\(100 \%\)). Якщо говорити більш математично, то координати кожного вектора виграшу складають до\(100\). Таким чином, сума однакова, або постійна, для кожного результату.

    Напевно, просто побачити з матриці в таблиці\(2.1.2\), що гравець 2 завжди вибирає великий шматок, таким чином, гравець 1 робить найкраще, щоб розрізати торт рівномірно. Результатом гри є стратегічна пара, позначена [Вирізати рівномірно, більший шматок], з результуючим вектором виграшу\((50, 50)\text{.}\)

    Але чому ми будемо називати ці ігри «нульовою сумою», а не «постійною сумою»? Ми можемо перетворити будь-яку гру з нульовою сумою в гру, де виплати насправді сума дорівнює нулю.

    Приклад Template:index: Покерні виплати переглянуто

    Розглянемо наведену вище гру в покер, де кожен гравець починає гру с\($100\). Припустимо, в якийсь момент гри п'ять гравців мають такі суми грошей:\($50\),\($200\),\($140\),\($100\),\($10\). Тоді ми могли б думати про їх виграш як\(-$50\),\($100\),\($40\),\($0\),\(-$90\). До чого складаються ці п'ять чисел?

    Приклад Template:index

    Перетворіть виплати ділення тортів так, щоб вектори виплат сумувалися нулю (а не\(100\)).

    Рішення наведено в табл\(2.1.3\).

    Таблиця 2.1.3: Матриця виплат з нульовою сумою для гри на різання тортів.
    вибирач
    Більший шматок Менший шматок
    Різак Вирізати рівномірно \((0, 0)\) \((0, 0)\)
    Вирізати нерівномірно \((-10, 10)\) \((10, -10)\)

    Але давайте переконаємося, що ми розуміємо, що означають ці цифри. Наприклад, виграш не означає, що кожен гравець не отримує торта, це означає, що вони не отримують більше торта, ніж інший гравець.\((0,0)\) У цьому прикладі кожен гравець отримує половину пирога (\(50 \%\)) плюс виграш.

    У формі Прикладу легко\(2.1.4\) розпізнати гру з нульовою сумою, оскільки кожен вектор виграшу має форму\((a, -a)\) (або\((-a, a)\)).

    2.1.1: Приклад - гра передвиборної кампанії

    Два кандидати, Арнольд і Бейнбрідж, стикаються один з одним на державних виборах. У них є три варіанти щодо питання обмеження швидкості на I-\(5\): Вони можуть підтримувати підвищення обмеження швидкості до\(70\) MPH, вони можуть підтримувати збереження поточного обмеження швидкості, або вони можуть повністю ухилитися від проблеми. Наступні три приклади представляють три різні матриці виплат для Арнольда і Бейнбріджа.

    Приклад Template:index: Проблема обмеження швидкості

    Кандидати мають інформацію, наведену в таблиці\(2.1.4\) про те, як вони, ймовірно, тариф на виборах, виходячи з того, як вони стоять на обмеження швидкості.

    Таблиця 2.1.4: Відсоток голосів, наприклад\(2.1.5\).
    \ (2.1.5\).» клас = "lt-математика-82759"> Бейнбрідж
    \ (2.1.5\).» клас = "lt-математика-82759"> Підняти ліміт Тримати ліміт Додж
    \ (2.1.5\).» рядки span="3" Клас = «LT-Math-82759">Арнольд Підняти ліміт \((45, 55)\) \((50, 50)\) \((40, 60)\)
    Тримати ліміт \((60, 40)\) \((55, 45)\) \((50, 50)\)
    Додж \((45, 55)\) \((55, 45)\) \((40, 60)\)
    Вправа Template:index: Аналіз виборчої гри

    Для наступних питань припустимо, що Арнольд і Бейнбрідж мають матрицю виплат, наведену в прикладі\(2.1.5\).

    1. Поясніть, чому\(2.1.5\) Example - це гра з нульовою сумою.
    2. Що повинен зробити Арнольд? Що слід вибрати для Bainbridge? Обов'язково поясніть вибір кожного кандидата. І пам'ятайте, гравець не просто хоче, щоб виграти, він хоче отримати НАЙБІЛЬШ votes— наприклад, ви можете припустити, що це номери опитування і що є деяка похибка, таким чином, кандидат вважає за краще мати більший запас над своїм опонентом!
    3. Який результат виборів?
    4. Чи потрібно Арнольду розглядати стратегії Бейнбріджа, щоб визначитися зі своєю власною стратегією? Чи потрібно Бейнбріджу враховувати стратегії Арнольда, щоб визначитися з його власною стратегією? Поясніть свою відповідь.
    Приклад Template:index: Новий сценарій

    Мати Бейнбріджа постраждала в аварії на шосе, спричиненої перевищенням швидкості. Нова матриця виплат наведена в табл\(2.1.6\).

    Таблиця 2.1.5: Відсоток голосів, наприклад\(2.1.6\).
    \ (2.1.6\).» клас = "lt-математика-82759"> Бейнбрідж
    \ (2.1.6\).» клас = "lt-математика-82759"> Підняти ліміт Тримати ліміт Додж
    \ (2.1.6\).» рядки span="3" Клас = «LT-Math-82759">Арнольд Підняти ліміт \((45, 55)\) \((10, 90)\) \((40, 60)\)
    Тримати ліміт \((60, 40)\) \((55, 45)\) \((50, 50)\)
    Додж \((45, 55)\) \((10, 90)\) \((40, 60)\)
    Вправа Template:index: Аналіз другого сценарію

    Для наступних питань припустимо, що Арнольд і Бейнбрідж мають матрицю виплат, наведену в прикладі\(2.1.6\).

    1. Поясніть, чому\(2.1.6\) Example - це гра з нульовою сумою.
    2. Що повинен зробити Арнольд? Що слід вибрати для Bainbridge? Обов'язково поясніть вибір кожного кандидата.
    3. Який результат виборів?
    4. Чи потрібно Арнольду розглядати стратегії Бейнбріджа, щоб визначитися зі своєю власною стратегією? Чи потрібно Бейнбріджу враховувати стратегії Арнольда, щоб визначитися з його власною стратегією? Поясніть свою відповідь.
    Приклад Template:index: Третій сценарій

    Bainbridge починає виступати на виборах в університетських містечках та мітингах монстрів. Нова матриця виплат наведена в табл\(2.1.6\).

    Таблиця 2.1.6: Відсоток голосів, наприклад\(2.1.7\).
    \ (2.1.7\).» клас = "lt-математика-82759"> Бейнбрідж
    \ (2.1.7\).» клас = "lt-математика-82759"> Підняти ліміт Тримати ліміт Додж
    \ (2.1.7\).» рядки span="3" Клас="LT-математика-82759">Арнольд Підняти ліміт \((35, 65)\) \((10, 90)\) \((60, 40)\)
    Тримати ліміт \((45, 55)\) \((55, 45)\) \((50, 50)\)
    Додж \((40, 60)\) \((10, 90)\) \((65, 35)\)
    Вправа Template:index: Аналіз третього сценарію

    Для наступних питань припустимо, що Арнольд і Бейнбрідж мають матрицю виплат, наведену в прикладі\(2.1.7\).

    1. Поясніть, чому\(2.1.7\) Example - це гра з нульовою сумою.
    2. Що повинен зробити Арнольд? Що слід вибрати для Bainbridge? Обов'язково поясніть вибір кожного кандидата.
    3. Який результат виборів?
    4. Чи потрібно Арнольду розглядати стратегії Бейнбріджа, щоб визначитися зі своєю власною стратегією? Чи потрібно Бейнбріджу враховувати стратегії Арнольда, щоб визначитися з його власною стратегією? Поясніть свою відповідь.
    Вправа Template:index: Зміна стратегії

    У кожному з перерахованих вище сценаріїв чи є якісь підстави для того, щоб Арнольд чи Бейнбрідж змінили свою стратегію? Якщо є, поясніть, за яких обставин має сенс змінити стратегію. Якщо ні, поясніть, чому ніколи не має сенсу змінювати стратегію.

    2.1.2: Пари рівноваги

    Швидше за все, в кожній з вправ вище ви змогли визначити, що повинен робити кожен гравець. Зокрема, якщо обидва гравці грають у запропоновані вами стратегії, немає підстав для того, щоб будь-який гравець змінювався на іншу стратегію.

    Визначення: Рівноважна пара

    Пара стратегій - це рівноважна пара, якщо жоден гравець не отримує, змінюючи стратегії.

    Для прикладу розглянемо матрицю гри з Example\(1.2.1\), Table\(1.2.3\).

    Таблиця\(2.1.7\): Матриця виплат для прикладу\(1.2.1\)
    \ (2.1.7\): Матриця виплат для прикладу\(1.2.1\) «> Гравець 2
    \ (2.1.7\): Матриця виплат для прикладу\(1.2.1\) «> Х У
    \ (2.1.7\): Матриця виплат, наприклад\(1.2.1\) "RowSpan="2">Гравець 1 A \((100, -100)\) \((-10, 10)\)
    Б \((0, 0)\) \((-1, 11)\)

    Ви визначили, що гравець 2 повинен вибрати гру Y, і, таким чином, гравець 1 повинен грати B (тобто у нас є стратегічна пара [B, Y]). Чому це рівноважна пара? Якщо гравець 2 грає Y, чи є у гравця 1 підстави перейти на стратегію A? Ні, вона втратила б\(10\) замість\(1\)! Якщо гравець 1 грає B, чи є у гравця 2 якісь підстави перейти на стратегію X? Ні, вона виграла б\(0\) замість\(1\)! Таким чином, жоден гравець не виграє від зміни стратегії, і так ми говоримо [B, Y] є рівноважною парою.

    Наразі ми можемо використовувати метод «вгадай і перевіряй» для пошуку пар рівноваги. Візьміть кожен результат і вирішіть, чи віддасть перевагу будь-якому гравцеві перемикатися. Пам'ятайте, що гравець 1 може вибрати лише інший рядок, а гравець 2 може вибрати лише інший стовпець. У нашому наведеному вище прикладі є чотири результати для перевірки: [A, X], [A, Y], [B, X] та [B, Y]. Ми вже знаємо, що [B, Y] - це рівноважна пара, але давайте перевіримо решту. Припустимо, гравці грають [A, X]. Гравець 1 хоче перейти на B? Ні, вона краще отримає\(100\), ніж\(0\). Гравець 2 хоче перейти на Y? Так! Вона краще отримає\(10\), ніж\(-100\). Отже, [A, X] НЕ є рівноважною парою, оскільки гравець хоче переключитися. Тепер перевірте, що для [A, Y] Гравець 1 хотів би перейти, а для [B, X] обидва гравці хотіли б переключитися. Таким чином [A, Y] і [B, X] НЕ є рівноважними парами. Тепер ви можете спробувати знайти пари рівноваги в будь-якій грі матриці, просто перевіряючи кожен вектор виграшу, щоб побачити, чи хотів би один з гравців перейти на іншу стратегію.

    Вправа Template:index: Перевірка пар рівноваги

    Чи є пари стратегій, які ви визначили в трьох виборчих сценаріях рівноваги пар? Іншими словами, чи вважає за краще будь-який гравець змінювати стратегії? (Вам не потрібно перевіряти, чи є будь-які інші стратегії рівноважними парами.)

    Вправа Template:index: Використання «Вгадай і перевіряй}

    Використовуйте метод «вгадати та перевірити», щоб визначити будь-які рівноважні пари для наступних матриць виплат.

    1. \(\begin{bmatrix}(2,-2) & (2,-2) \\(1,-1) & (3,-3) \end{bmatrix}\)
  • \(\begin{bmatrix}(3,-3) & (1,-1) \\(2,-2) & (4,-4) \end{bmatrix}\)
  • \(\begin{bmatrix}(4,-4) & (5,-5) \\(4,-4) & (3,-3) \end{bmatrix}\)
  • Спробувавши наведені вище приклади, ви думаєте, що кожна гра має рівноважну пару? Чи можуть ігри мати кілька пар рівноваги?

    Вправа Template:index: Існування пар рівноваги

    Чи всі ігри мають рівноважні пари?

    Вправа Template:index: Кілька пар рівноваги

    Чи може гра мати більше однієї рівноважної пари?

    Останні три вправи дають вам ще кілька ігор для практики.

    Вправа Template:index: Камінь, Папір, Ножиці

    Розглянемо гру РОК, ПАПІР, НОЖИЦІ (Рок б'є Ножиці, Ножиці бити папір, Папір б'є рок). Побудувати матрицю виплат для цієї гри. Чи має вона рівноважну пару? Поясніть свою відповідь.

    Вправа Template:index: Битва мереж

    Дві телевізійні мережі борються за глядачів за\(7\) вечора в понеділок ввечері. Кожен з них повинен вирішити, чи збираються вони показати ситком або спортивну подію. Таблиця\(2.1.8\) дає виплати у відсотках глядачів.

    Таблиця\(2.1.8\): Матриця виплат для Битви Мереж
    \ (2.1.8\): Матриця виплат для битви мереж"> Мережа 2
    \ (2.1.8\): Матриця виплат для битви мереж"> Ситком Спорт
    \ (2.1.8\): Матриця виплат для битви мереж» RowSpan="2">Мережа 1 Ситком \((55, 45)\) \((52, 48)\)
    Спорт \((50, 50)\) \((45, 55)\)
    1. Поясніть, чому це гра з нульовою сумою.
    2. Чи має ця гра рівноважна пара? Якщо так, знайдіть його і поясніть, що повинна робити кожна мережа.
    3. Перетворіть цю гру в ту, в якій виплати фактично дорівнюють нулю. Підказка: якщо мережа виграє\(60 \%\) глядачів, скільки більше 50% глядачів вона має?
    Вправа Template:index: Конкурентна перевага

    Ця гра є прикладом того, що економісти називають конкурентною перевагою. Дві конкуруючі фірми повинні вирішити, приймати чи ні новий тип технології. Матриця виплат знаходиться в табл\(2.1.9\). Змінна\(a\) є позитивним числом, що представляє економічну перевагу, яку отримає фірма, якщо вона першою прийме нову технологію.

    Таблиця\(2.1.9\): Матриця виплат за конкурентну перевагу
    \ (2.1.9\): Матриця виплат за конкурентну перевагу"> Фірма B
    \ (2.1.9\): Матриця виплат за конкурентну перевагу"> Прийняти нові технології Залишайтеся на місці
    \ (2.1.9\): Матриця виплат для конкурентних переваг» RowSpan = «2">Фірма A Прийняти нові технології \((0, 0)\) \((a, -a)\)
    Залишайтеся на місці \((-a, a)\) \((0, 0)\)
    1. Поясніть вектор виплат для кожної пари стратегій. Наприклад, чому пара [Adopt New Tech, Stay Put] повинна мати виграш\((a, -a)\text{?}\)
    2. Поясніть, що повинна робити кожна фірма.
    3. Наведіть реальний життєвий приклад конкурентної переваги.

    Ми бачили, як описати гру з нульовою сумою і як знайти пари рівноваги. Ми спробували вирішити, якою має бути стратегія кожного гравця. Кожному гравцеві може знадобитися розглянути стратегію іншого гравця, щоб визначити свою найкращу стратегію. Але ми повинні бути обережними, хоча наша інтуїція може бути корисною при вирішенні найкращої стратегії, ми хотіли б бути більш точними щодо пошуку стратегій для кожного гравця. Деякі з цих інструментів ми дізнаємося в наступному розділі.