7.3: Модель Mk
- Page ID
- 4853
Найосновніша модель еволюції дискретних символів називається моделлю Мк. Вперше розроблений для даних ознак Pagel (1994; хоча назва Mk походить від Льюїса 2001). Модель Mk є прямим аналогом моделі Джукса-Кантора (JC) для еволюції послідовностей. Модель застосовується до дискретного символу, що має k невпорядкованих станів. Такий символ може мати k = 2, k = 3 або навіть більше станів. Еволюція передбачає зміну між цими k станами (рис. 7.3).

Базова версія моделі Мк передбачає, що переходи між цими станами слідують за марковським процесом. Це означає, що ймовірність переходу від одного стану до іншого залежить тільки від поточного стану, а не від того, що настало раніше. Наприклад, не має ніякої різниці, якщо родовід щойно розвинув рису «пір'я», чи вони мали пір'я мільйони років - ймовірність розвитку іншого стану характеру однакова в обох випадках. Базова модель Mk також передбачає, що кожна держава однаково ймовірно зміниться на будь-яку іншу державу.
Для базової моделі Mk ми можемо позначити миттєву швидкість зміни між станами за допомогою параметра q. У загальному випадку q i j називається миттєва швидкість між символьними станами i і j. Він визначається як межа швидкості, виміряної за дуже короткі проміжки часу 1.
Знову ж таки, для базової моделі Mk миттєві швидкості між усіма парами символів рівні; тобто q i j = q m n для всіх i ≠ j і m ≠ n.
Можна узагальнити загальні моделі Маркова для дискретних символів за допомогою матриці швидкості переходу (Lewis 2001):
\[ \mathbf{Q} = \begin{bmatrix} -d_1 & q_{12} & \dots & q_{1k} \\ q_{21} & -d_2 & \dots & q_{2k} \\ \vdots & \vdots & \ddots & \vdots\\ q_{k1} & q{k2} & \dots & -d_k \\ \end{bmatrix} \label{7.1}\]
Зверніть увагу, що миттєві швидкості вводяться тільки в позадіагональні частини матриці. Уздовж діагоналі ці матриці завжди мають набір від'ємних чисел. Для будь-якої Q матриці сума всіх елементів у кожному рядку дорівнює нулю — необхідна умова для матриці швидкості переходу. Через це кожне від'ємне число має значення d i, рівне сумі всіх інших чисел у рядку. Наприклад,
\[ d_1 = \sum_{i=2}^{k} q_{1i} \label{7.2}\]
Для моделі з двома станами Mk k = 2 і швидкості симетричні так, що q 12 = q 21. У цьому випадку ми можемо записати матрицю швидкості переходу як:
\[ \mathbf{Q} = \begin{bmatrix} -q & q \\ q & -q \\ \end{bmatrix} \label{7.3}\]
Аналогічно для k = 3 матриця швидкості переходу дорівнює:
\[ \mathbf{Q} = \begin{bmatrix} -2 q & q & q\\ q & -2 q & q\\ q & q & -2 q\\ \end{bmatrix} \label{7.4}\]
В цілому матриця переходу k-стану для базової моделі Mk така:
\[ \mathbf{Q} = \begin{bmatrix} 1-k & 1 & \dots & 1\\ 1 & 1-k & \dots & 1\\ \vdots & \vdots & \ddots & \vdots\\ 1 & 1 & \dots & 1\\ \end{bmatrix} \label{7.5}\]
Після того, як ми отримаємо цю матрицю швидкості переходу, ми можемо обчислити розподіл ймовірностей станів ознак через будь-який часовий інтервал t за допомогою рівняння (Lewis 2001):
\[\textbf{P}(t)=e^{\textbf{Q}t} \label{7.6}\]
Це рівняння виглядає простим, але обчислення P (t) включає матричне зведення в ступінь - підвищення e до ступеня, визначеної матрицею. Цей розрахунок істотно відрізняється від підняття e до потужності, визначеної кожним елементом матриці 2. Результатом є матриця, P, ймовірностей переходу. Кожен елемент цієї матриці (p i j) дає ймовірність того, що починаючи з стану i ви опинитеся в стані j за цей проміжок часу t. Для стандартної моделі Мк існує загальне рішення цього рівняння:
\[ \begin{array}{l} p_{ii}(t) = \frac{1}{k} + \frac{k-1}{k} e^{-kqt} \\ p_{ij}(t) = \frac{1}{k} - \frac{1}{k} e^{-kqt} \\ \end{array} \label{7.7}\]
Зокрема, коли k = 2,
\[ \begin{array}{l} p_{ii}(t) = \frac{1}{k} + \frac{k-1}{k} e^{-kqt} = \frac{1}{2} + \frac{2-1}{2}e^{-2qt}=\frac{1+e^{-2qt}}{2} \\ p_{ij}(t) = \frac{1}{k} - \frac{1}{k} e^{-kqt} = \frac{1}{2} - \frac{1}{2}e^{-2qt}=\frac{1-e^{-2qt}}{2} \\ \end{array} \label{7.8}\]
Якщо врахувати, що відбувається, коли час стає дуже великим у цих рівняннях, ми бачимо цікаву закономірність. Будь-який термін, який має e − t, стає все ближче і ближче до нуля зі збільшенням t. Через це для всіх значень k кожне p i j (t) сходиться до постійної величини, 1/ k. Це стаціонарний розподіл символьних станів, π, що визначається як рівноважна частота характерних станів, якщо процес виконується багато разів протягом досить тривалого періоду часу. В цілому стаціонарна розводка моделі Мк буває:
\[ \pi = \begin{bmatrix} 1/k & 1/k & \dots & 1/k\\ \end{bmatrix} \label{7.9}\]
У разі\(k = 2\),
\[ \pi = \begin{bmatrix} 1/2 & 1/2 \\ \end{bmatrix} \label{7.10}\]