Skip to main content
LibreTexts - Ukrayinska

7.3: Модель Mk

  • Page ID
    4853
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Найосновніша модель еволюції дискретних символів називається моделлю Мк. Вперше розроблений для даних ознак Pagel (1994; хоча назва Mk походить від Льюїса 2001). Модель Mk є прямим аналогом моделі Джукса-Кантора (JC) для еволюції послідовностей. Модель застосовується до дискретного символу, що має k невпорядкованих станів. Такий символ може мати k = 2, k = 3 або навіть більше станів. Еволюція передбачає зміну між цими k станами (рис. 7.3).

    Малюнок 7.3. Приклади дискретних символів з (A) k = 2, (B) k = 3, а (C) k = 4 станами. Зображення автора, може бути використано повторно за ліцензією CC-BY-4.0.
    Малюнок 7.3. Приклади дискретних символів з (A) k = 2, (B) k = 3, а (C) k = 4 станами. Зображення автора, може бути використано повторно за ліцензією CC-BY-4.0.

    Базова версія моделі Мк передбачає, що переходи між цими станами слідують за марковським процесом. Це означає, що ймовірність переходу від одного стану до іншого залежить тільки від поточного стану, а не від того, що настало раніше. Наприклад, не має ніякої різниці, якщо родовід щойно розвинув рису «пір'я», чи вони мали пір'я мільйони років - ймовірність розвитку іншого стану характеру однакова в обох випадках. Базова модель Mk також передбачає, що кожна держава однаково ймовірно зміниться на будь-яку іншу державу.

    Для базової моделі Mk ми можемо позначити миттєву швидкість зміни між станами за допомогою параметра q. У загальному випадку q i j називається миттєва швидкість між символьними станами i і j. Він визначається як межа швидкості, виміряної за дуже короткі проміжки часу 1.

    Знову ж таки, для базової моделі Mk миттєві швидкості між усіма парами символів рівні; тобто q i j = q m n для всіх ij і mn.

    Можна узагальнити загальні моделі Маркова для дискретних символів за допомогою матриці швидкості переходу (Lewis 2001):

    \[ \mathbf{Q} = \begin{bmatrix} -d_1 & q_{12} & \dots & q_{1k} \\ q_{21} & -d_2 & \dots & q_{2k} \\ \vdots & \vdots & \ddots & \vdots\\ q_{k1} & q{k2} & \dots & -d_k \\ \end{bmatrix} \label{7.1}\]

    Зверніть увагу, що миттєві швидкості вводяться тільки в позадіагональні частини матриці. Уздовж діагоналі ці матриці завжди мають набір від'ємних чисел. Для будь-якої Q матриці сума всіх елементів у кожному рядку дорівнює нулю — необхідна умова для матриці швидкості переходу. Через це кожне від'ємне число має значення d i, рівне сумі всіх інших чисел у рядку. Наприклад,

    \[ d_1 = \sum_{i=2}^{k} q_{1i} \label{7.2}\]

    Для моделі з двома станами Mk k = 2 і швидкості симетричні так, що q 12 = q 21. У цьому випадку ми можемо записати матрицю швидкості переходу як:

    \[ \mathbf{Q} = \begin{bmatrix} -q & q \\ q & -q \\ \end{bmatrix} \label{7.3}\]

    Аналогічно для k = 3 матриця швидкості переходу дорівнює:

    \[ \mathbf{Q} = \begin{bmatrix} -2 q & q & q\\ q & -2 q & q\\ q & q & -2 q\\ \end{bmatrix} \label{7.4}\]

    В цілому матриця переходу k-стану для базової моделі Mk така:

    \[ \mathbf{Q} = \begin{bmatrix} 1-k & 1 & \dots & 1\\ 1 & 1-k & \dots & 1\\ \vdots & \vdots & \ddots & \vdots\\ 1 & 1 & \dots & 1\\ \end{bmatrix} \label{7.5}\]

    Після того, як ми отримаємо цю матрицю швидкості переходу, ми можемо обчислити розподіл ймовірностей станів ознак через будь-який часовий інтервал t за допомогою рівняння (Lewis 2001):

    \[\textbf{P}(t)=e^{\textbf{Q}t} \label{7.6}\]

    Це рівняння виглядає простим, але обчислення P (t) включає матричне зведення в ступінь - підвищення e до ступеня, визначеної матрицею. Цей розрахунок істотно відрізняється від підняття e до потужності, визначеної кожним елементом матриці 2. Результатом є матриця, P, ймовірностей переходу. Кожен елемент цієї матриці (p i j) дає ймовірність того, що починаючи з стану i ви опинитеся в стані j за цей проміжок часу t. Для стандартної моделі Мк існує загальне рішення цього рівняння:

    \[ \begin{array}{l} p_{ii}(t) = \frac{1}{k} + \frac{k-1}{k} e^{-kqt} \\ p_{ij}(t) = \frac{1}{k} - \frac{1}{k} e^{-kqt} \\ \end{array} \label{7.7}\]

    Зокрема, коли k = 2,

    \[ \begin{array}{l} p_{ii}(t) = \frac{1}{k} + \frac{k-1}{k} e^{-kqt} = \frac{1}{2} + \frac{2-1}{2}e^{-2qt}=\frac{1+e^{-2qt}}{2} \\ p_{ij}(t) = \frac{1}{k} - \frac{1}{k} e^{-kqt} = \frac{1}{2} - \frac{1}{2}e^{-2qt}=\frac{1-e^{-2qt}}{2} \\ \end{array} \label{7.8}\]

    Якщо врахувати, що відбувається, коли час стає дуже великим у цих рівняннях, ми бачимо цікаву закономірність. Будь-який термін, який має e t, стає все ближче і ближче до нуля зі збільшенням t. Через це для всіх значень k кожне p i j (t) сходиться до постійної величини, 1/ k. Це стаціонарний розподіл символьних станів, π, що визначається як рівноважна частота характерних станів, якщо процес виконується багато разів протягом досить тривалого періоду часу. В цілому стаціонарна розводка моделі Мк буває:

    \[ \pi = \begin{bmatrix} 1/k & 1/k & \dots & 1/k\\ \end{bmatrix} \label{7.9}\]

    У разі\(k = 2\),

    \[ \pi = \begin{bmatrix} 1/2 & 1/2 \\ \end{bmatrix} \label{7.10}\]