1.2: Ігрові матриці та вектори виплат
- Page ID
- 65713
Нам потрібен спосіб описати можливі варіанти вибору для гравців та результати цього вибору. Наразі ми будемо дотримуватися ігор, в яких є лише два гравці. Ми будемо називати їх Гравець 1 і Гравець 2.
1.2.1: Приклад - Відповідність копійки
Припустимо, у кожного гравця є два варіанти: Heads (H) або Tails (T). Якщо вони вибирають однакову букву, то гравець 1 виграє\($1\) від гравця 2. Якщо вони не збігаються, то Гравець 1 програє\($1\) гравцеві 2. Ми можемо уявити всі можливі результати гри за допомогою матриці.
Параметри гравця 1 завжди будуть відповідати рядкам матриці, а параметри гравця 2 будуть відповідати стовпцям. Див\(1.2.1\). Таблицю.
Таблиця\(1.2.1\): Матриця ігор, що показує стратегії для кожного гравця | |||
---|---|---|---|
\ (1.2.1\): Матриця ігор, яка показує стратегії для кожного гравця"> | Гравець 2 | ||
\ (1.2.1\): Матриця ігор, яка показує стратегії для кожного гравця"> | Керівник | Хвіст | |
\ (1.2.1\): Ігрова матриця, яка показує стратегії для кожного гравця» RowSpan="2">Гравець 1 | Керівник | ||
Хвіст |
Виплата - це сума, яку гравець отримує за даний результат гри.
Тепер ми можемо заповнити матрицю з виграшем кожного гравця. Оскільки виграші для кожного гравця різні, ми будемо використовувати впорядковані пари, де перше число - це виграш гравця 1, а друге - виграш гравця 2. Впорядкована пара називається вектором виплати. Наприклад, якщо обидва гравці вибирають H, то виграш гравця 1 буде\($1\) і виграш гравця 2\(-$1\) (оскільки він програє гравцеві 1). Таким чином, вектор виграшу, пов'язаний з результатом H, H дорівнює\((1, -1)\text{.}\)
Заповнюємо матрицю відповідними векторами виплат в табл\(1.2.2\).
Таблиця\(1.2.2\): Матриця гри, що показує вектори виграшів | |||
---|---|---|---|
\ (1.2.2\): Матриця гри, що показує вектори виплат «> | Гравець 2 | ||
\ (1.2.2\): Матриця гри, що показує вектори виплат «> | Керівник | Хвіст | |
\ (1.2.2\): Матриця гри, що показує вектори виплат» RowSpan = «2">Гравець 1 | Керівник | \((1, -1)\) | \((-1, 1)\) |
Хвіст | \((-1, 1)\) | \((1, -1)\) |
Корисно думати про різні способи кількісної оцінки виграшу і програшу. Які можливі показники вартості? Наприклад, ми могли б використовувати гроші, фішки, лічильники, голоси, бали, кількість торта тощо.
Пам'ятайте, гравець завжди вважає за краще виграти БІЛЬШІСТЬ очок (гроші, фішки, голоси, торт), а не просто більше, ніж її опонент. Якщо ви хочете вивчити гру, де гравці просто виграють або програють (наприклад, Tic Tac Toe), ми могли б просто використовувати «\(1\)» для перемоги і «\(-1\)» для програшу.
1.2.2: Розуміння гравців
Нагадаємо, що ми сказали, що є два основні припущення, які ми повинні зробити щодо наших гравців:
- Наші гравці зацікавлені в собі. Це означає, що вони завжди віддадуть перевагу максимально можливій віддачі. Вони виберуть стратегію, яка максимізує їх виграш.
- Наші гравці цілком логічні. Це означає, що вони будуть використовувати всю наявну інформацію і зроблять для себе наймудріший вибір.
Важливо відзначити, що кожен гравець також знає, що його суперник також корисливий і цілком логічний!
- Яку винагороду гравець віддає перевагу:\(0\),\(2\), або\(-2\)?
- Яку винагороду гравець віддає перевагу:\(-2\),\(-5\), або\(-10\)?
- Яку винагороду гравець віддає перевагу:\(-1\),\(-3\), або\(0\)?
Це може бути просто вирішити найкращий виграш для гравця зі списку цінностей, і було б чудово, якби гравець міг просто визначити найбільше значення в таблиці і вибрати цю стратегію. Однак, коли є два гравці, гравцеві, можливо, доведеться вибирати стратегію більш ретельно, оскільки гравець 1 може вибрати лише рядок, а Гравець 2 може вибрати лише стовпець. Таким чином, результат гри залежить від ОБОХ гравців.
Припустимо, що два гравці грають у гру, в якій вони можуть вибрати A або B з виграшами, наведеними в ігровій матриці в таблиці\(1.2.3\).
Таблиця\(1.2.3\): Матриця виплат для фізичних вправ\(1.2.2\) | |||
---|---|---|---|
\ (1.2.3\): Матриця виплат для вправи\(1.2.2\) «> | Гравець 2 | ||
\ (1.2.3\): Матриця виплат для вправи\(1.2.2\) «> | A | Б | |
\ (1.2.3\): Матриця виплат для вправи\(1.2.2\) "RowSpan = «2">Гравець 1 | A | \((100, -100)\) | \((-10, 10)\) |
Б | \((0, 0)\) | \((-1, 11)\) |
У наступній вправі ми спробуємо визначити, що повинен робити кожен гравець.
- Просто швидко дивлячись на матрицю, який гравець, здається, зможе виграти більше, ніж інший гравець? Чи один гравець, здається, має перевагу? Поясніть.
- Визначте, що повинен робити кожен гравець. Поясніть свою відповідь.
- Порівняйте свою відповідь в (b) з вашою відповіддю в (а). Чи гравець, який ви запропонували в (а) насправді виграв більше, ніж інший гравець?
- Відповідно до вашої відповіді в (b), гравець 1 в кінцевому підсумку з найбільшою можливою виплати (для гравця 1) в матриці?
- Згідно з вашою відповіддю в (b), гравець 2 в кінцевому підсумку з найбільшим можливим виграшем (для гравця 2) в матриці?
- Ви все ще думаєте, що гравець має перевагу в цій грі? Це та ж відповідь, що і в (а)?
Припустимо, є два гравці з ігровою матрицею, наведеною в таблиці\(1.2.4\).
Таблиця\(1.2.4\): Матриця виплат для фізичних вправ\(1.2.3\) | ||||
---|---|---|---|---|
\ (1.2.4\): Матриця виплат для вправи\(1.2.3\) «> | Гравець 2 | |||
\ (1.2.4\): Матриця виплат для вправи\(1.2.3\) «> | Х | У | Z | |
\ (1.2.4\): Матриця виплат для вправи\(1.2.3\) "RowSpan = «3">Гравець 1 | A | \((1000, -1000)\) | \((-5, 5)\) | \((-15,15)\) |
Б | \((200, -200)\) | \((0, 0)\) | \((-5,5)\) | |
C | \((500, -500)\) | \((20, -20)\) | \((-25,25)\) |
У наступній вправі ми спробуємо визначити, що повинен робити кожен гравець.
- Просто швидко дивлячись на матрицю, який гравець, здається, зможе виграти більше, ніж інший гравець? Чи один гравець, здається, має перевагу? Поясніть.
- Визначте, що повинен робити кожен гравець. Поясніть свою відповідь.
- Порівняйте свою відповідь в (b) з вашою відповіддю в (а). Чи гравець, який ви запропонували в (а) насправді виграв більше, ніж інший гравець?
- Відповідно до вашої відповіді в (b), гравець 1 в кінцевому підсумку з найбільшою можливою виплати (для гравця 1) в матриці?
- Згідно з вашою відповіддю в (b), гравець 2 в кінцевому підсумку з найбільшим можливим виграшем (для гравця 2) в матриці?
- Ви все ще думаєте, що гравець має перевагу в цій грі? Це та ж відповідь, що і в (а)?
Цей розділ познайомив вас з тим, хто такі гравці, і як організувати стратегії та виплати в матрицю. У наступному розділі ми вивчимо деякі методи того, як гравець може визначити свою найкращу стратегію.