Skip to main content
LibreTexts - Ukrayinska

1.2: Ігрові матриці та вектори виплат

  • Page ID
    65713
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Нам потрібен спосіб описати можливі варіанти вибору для гравців та результати цього вибору. Наразі ми будемо дотримуватися ігор, в яких є лише два гравці. Ми будемо називати їх Гравець 1 і Гравець 2.

    1.2.1: Приклад - Відповідність копійки

    Припустимо, у кожного гравця є два варіанти: Heads (H) або Tails (T). Якщо вони вибирають однакову букву, то гравець 1 виграє\($1\) від гравця 2. Якщо вони не збігаються, то Гравець 1 програє\($1\) гравцеві 2. Ми можемо уявити всі можливі результати гри за допомогою матриці.

    Параметри гравця 1 завжди будуть відповідати рядкам матриці, а параметри гравця 2 будуть відповідати стовпцям. Див\(1.2.1\). Таблицю.

    Таблиця\(1.2.1\): Матриця ігор, що показує стратегії для кожного гравця
    \ (1.2.1\): Матриця ігор, яка показує стратегії для кожного гравця"> Гравець 2
    \ (1.2.1\): Матриця ігор, яка показує стратегії для кожного гравця"> Керівник Хвіст
    \ (1.2.1\): Ігрова матриця, яка показує стратегії для кожного гравця» RowSpan="2">Гравець 1 Керівник
    Хвіст
    Визначення: Виплата

    Виплата - це сума, яку гравець отримує за даний результат гри.

    Тепер ми можемо заповнити матрицю з виграшем кожного гравця. Оскільки виграші для кожного гравця різні, ми будемо використовувати впорядковані пари, де перше число - це виграш гравця 1, а друге - виграш гравця 2. Впорядкована пара називається вектором виплати. Наприклад, якщо обидва гравці вибирають H, то виграш гравця 1 буде\($1\) і виграш гравця 2\(-$1\) (оскільки він програє гравцеві 1). Таким чином, вектор виграшу, пов'язаний з результатом H, H дорівнює\((1, -1)\text{.}\)

    Заповнюємо матрицю відповідними векторами виплат в табл\(1.2.2\).

    Таблиця\(1.2.2\): Матриця гри, що показує вектори виграшів
    \ (1.2.2\): Матриця гри, що показує вектори виплат «> Гравець 2
    \ (1.2.2\): Матриця гри, що показує вектори виплат «> Керівник Хвіст
    \ (1.2.2\): Матриця гри, що показує вектори виплат» RowSpan = «2">Гравець 1 Керівник \((1, -1)\) \((-1, 1)\)
    Хвіст \((-1, 1)\) \((1, -1)\)

    Корисно думати про різні способи кількісної оцінки виграшу і програшу. Які можливі показники вартості? Наприклад, ми могли б використовувати гроші, фішки, лічильники, голоси, бали, кількість торта тощо.

    Пам'ятайте, гравець завжди вважає за краще виграти БІЛЬШІСТЬ очок (гроші, фішки, голоси, торт), а не просто більше, ніж її опонент. Якщо ви хочете вивчити гру, де гравці просто виграють або програють (наприклад, Tic Tac Toe), ми могли б просто використовувати «\(1\)» для перемоги і «\(-1\)» для програшу.

    1.2.2: Розуміння гравців

    Нагадаємо, що ми сказали, що є два основні припущення, які ми повинні зробити щодо наших гравців:

    • Наші гравці зацікавлені в собі. Це означає, що вони завжди віддадуть перевагу максимально можливій віддачі. Вони виберуть стратегію, яка максимізує їх виграш.
    • Наші гравці цілком логічні. Це означає, що вони будуть використовувати всю наявну інформацію і зроблять для себе наймудріший вибір.

    Важливо відзначити, що кожен гравець також знає, що його суперник також корисливий і цілком логічний!

    Вправа Template:index: Бажані виплати
    1. Яку винагороду гравець віддає перевагу:\(0\),\(2\), або\(-2\)?
    2. Яку винагороду гравець віддає перевагу:\(-2\),\(-5\), або\(-10\)?
    3. Яку винагороду гравець віддає перевагу:\(-1\),\(-3\), або\(0\)?

    Це може бути просто вирішити найкращий виграш для гравця зі списку цінностей, і було б чудово, якби гравець міг просто визначити найбільше значення в таблиці і вибрати цю стратегію. Однак, коли є два гравці, гравцеві, можливо, доведеться вибирати стратегію більш ретельно, оскільки гравець 1 може вибрати лише рядок, а Гравець 2 може вибрати лише стовпець. Таким чином, результат гри залежить від ОБОХ гравців.

    Приклад Template:index: A\(2\times 2\) Game.

    Припустимо, що два гравці грають у гру, в якій вони можуть вибрати A або B з виграшами, наведеними в ігровій матриці в таблиці\(1.2.3\).

    Таблиця\(1.2.3\): Матриця виплат для фізичних вправ\(1.2.2\)
    \ (1.2.3\): Матриця виплат для вправи\(1.2.2\) «> Гравець 2
    \ (1.2.3\): Матриця виплат для вправи\(1.2.2\) «> A Б
    \ (1.2.3\): Матриця виплат для вправи\(1.2.2\) "RowSpan = «2">Гравець 1 A \((100, -100)\) \((-10, 10)\)
    Б \((0, 0)\) \((-1, 11)\)

    У наступній вправі ми спробуємо визначити, що повинен робити кожен гравець.

    Вправа Template:index: Пошук стратегій
    1. Просто швидко дивлячись на матрицю, який гравець, здається, зможе виграти більше, ніж інший гравець? Чи один гравець, здається, має перевагу? Поясніть.
    2. Визначте, що повинен робити кожен гравець. Поясніть свою відповідь.
    3. Порівняйте свою відповідь в (b) з вашою відповіддю в (а). Чи гравець, який ви запропонували в (а) насправді виграв більше, ніж інший гравець?
    4. Відповідно до вашої відповіді в (b), гравець 1 в кінцевому підсумку з найбільшою можливою виплати (для гравця 1) в матриці?
    5. Згідно з вашою відповіддю в (b), гравець 2 в кінцевому підсумку з найбільшим можливим виграшем (для гравця 2) в матриці?
    6. Ви все ще думаєте, що гравець має перевагу в цій грі? Це та ж відповідь, що і в (а)?
    Приклад Template:index: A\(3\times 3\) Game.

    Припустимо, є два гравці з ігровою матрицею, наведеною в таблиці\(1.2.4\).

    Таблиця\(1.2.4\): Матриця виплат для фізичних вправ\(1.2.3\)
    \ (1.2.4\): Матриця виплат для вправи\(1.2.3\) «> Гравець 2
    \ (1.2.4\): Матриця виплат для вправи\(1.2.3\) «> Х У Z
    \ (1.2.4\): Матриця виплат для вправи\(1.2.3\) "RowSpan = «3">Гравець 1 A \((1000, -1000)\) \((-5, 5)\) \((-15,15)\)
    Б \((200, -200)\) \((0, 0)\) \((-5,5)\)
    C \((500, -500)\) \((20, -20)\) \((-25,25)\)

    У наступній вправі ми спробуємо визначити, що повинен робити кожен гравець.

    Вправа Template:index: Більше практики пошуку стратегій
    1. Просто швидко дивлячись на матрицю, який гравець, здається, зможе виграти більше, ніж інший гравець? Чи один гравець, здається, має перевагу? Поясніть.
    2. Визначте, що повинен робити кожен гравець. Поясніть свою відповідь.
    3. Порівняйте свою відповідь в (b) з вашою відповіддю в (а). Чи гравець, який ви запропонували в (а) насправді виграв більше, ніж інший гравець?
    4. Відповідно до вашої відповіді в (b), гравець 1 в кінцевому підсумку з найбільшою можливою виплати (для гравця 1) в матриці?
    5. Згідно з вашою відповіддю в (b), гравець 2 в кінцевому підсумку з найбільшим можливим виграшем (для гравця 2) в матриці?
    6. Ви все ще думаєте, що гравець має перевагу в цій грі? Це та ж відповідь, що і в (а)?

    Цей розділ познайомив вас з тим, хто такі гравці, і як організувати стратегії та виплати в матрицю. У наступному розділі ми вивчимо деякі методи того, як гравець може визначити свою найкращу стратегію.