Skip to main content
LibreTexts - Ukrayinska

5.3: Моделювання еволюції корельованих символів

  • Page ID
    4208
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Ми можемо моделювати еволюцію множинних (потенційно корельованих) неперервних символів за допомогою багатоваріантної броунівської моделі руху. Ця модель схожа на уніваріативний броунівський рух (див. Розділ 3), але може моделювати еволюцію багатьох персонажів одночасно. Як і при одноваріантному броунівському русі, значення ознак змінюються випадковим чином як у напрямку, так і на відстані протягом будь-якого часового інтервалу. Однак тут ці зміни черпаються з багатоваріантних нормальних розподілів 2. Багатоваріантний броунівський рух може охоплювати ситуацію, коли кожен персонаж еволюціонує незалежно один від одного, але також може описувати ситуації, коли персонажі еволюціонують корельованим чином.

    Ми можемо описати багатоваріантне броунівське рух з набором параметрів, які описуються a, вектором філогенетичних засобів для набору r символів:

    (ур. 5,1)

    \[ \mathbf{a} = \begin{bmatrix} \bar{z}_1 (0) & \bar{z}_2 (0) & \dots & \bar{z}_r (0)\\ \end{bmatrix} \]

    Цей вектор представляє початкову точку в r -мірному просторі для нашої випадкової прогулянки. У контексті порівняльних методів це вимірювання характеру для лінії біля кореня дерева. Крім того, у нас є еволюційна матриця швидкості R:

    (ур. 5,2)

    \[ \mathbf{R} = \begin{bmatrix} \sigma_1^2 & \sigma_{21} & \dots & \sigma_{n1}\\ \sigma_{21} & \sigma_2^2 & \dots & \vdots\\ \vdots & \vdots & \ddots & \vdots\\ \sigma_{1n} & \dots & \dots & \sigma_{rn}^2\\ \end{bmatrix}\]

    Тут параметр швидкості для кожної осі (σ i 2) знаходиться по діагоналі матриці. Позадіагональні елементи представляють еволюційні коваріації між парами осей (зверніть увагу, що σ i j = σ j i). Варто відзначити, що кожен окремий персонаж еволюціонує під броунівським руховим процесом. Однак коваріації між символами потенційно роблять цю модель відмінною від тієї, де кожен символ розвивається незалежно від усіх інших (рис. 5.2).

    Малюнок 5.2. Гіпотетичні шляхи еволюції (стрілки) для (A) двох некорельованих ознак, (B) двох рис, що розвиваються з позитивною коваріацією, і (C) двох рис, що розвиваються з негативною коваріацією. Зауважте, що в (B), коли ознака 1 отримує більшу ознаку 2 також стає більшою, але в (C) позитивні зміни в ознаці 1 поєднуються з негативними змінами ознаки 2. Зображення автора, може бути використано повторно за ліцензією CC-BY-4.0.
    Малюнок 5.2. Гіпотетичні шляхи еволюції (стрілки) для (A) двох некорельованих ознак, (B) двох рис, що розвиваються з позитивною коваріацією, і (C) двох рис, що розвиваються з негативною коваріацією. Зауважте, що в (B), коли ознака 1 отримує більшу ознаку 2 також стає більшою, але в (C) позитивні зміни в ознаці 1 поєднуються з негативними змінами ознаки 2. Зображення автора, може бути використано повторно за ліцензією CC-BY-4.0.

    Якщо у вас є дані для декількох неперервних символів у багатьох видах разом з філогенетичним деревом, ви можете пристосувати до даних багатовимірну броунівську модель руху, як це обговорюється в розділі 3.

    Для обчислення ймовірності можна використовувати той факт, що при нашій багатоваріантної броунівської моделі руху спільний розподіл всіх ознак по всіх видах має багатовимірний нормальний розподіл. Після глави 3 ми знаходимо матрицю дисперсії-коваріації, яка описує цю модель шляхом об'єднання двох матриць R і C в одну велику матрицю за допомогою добутку Кроенекера:

    (ур. 5,3)

    V = Р С

    Ця матриця V дорівнює n r × n r. Потім ми можемо замінити V на C у рівнянні (4.5), щоб обчислити ймовірність:

    (ур. 5,4)

    \[ L(\mathbf{x}_{nr} | \mathbf{a}, \mathbf{R}, \mathbf{C}) = \frac {e^{-1/2 (\mathbf{x}_{nr}- \mathbf{D} \cdot \mathbf{a})^\intercal (\mathbf{V})^{-1} (\mathbf{x}_nr-\mathbf{D} \cdot \mathbf{a})}} {\sqrt{(2 \pi)^{nm} det(\mathbf{V})}} \]

    Тут D - n r × r конструктивна матриця, де кожен елемент D i j дорівнює 1, якщо (j − 1) ⋅ n < ijn і 0 в іншому випадку. x n r - єдиний вектор з усіма значеннями ознак для всіх видів, перерахованих таким чином, що перші n елементів вектора мають ознаку 1, наступні n - для ознаки 2 і так далі:

    (ур. 5,5)

    \[ \mathbf{x}_{nr} = \begin{bmatrix} x_{11} & x_{12} & \dots & x_{1n} & x_{21} & \dots & x_{nr}\\ \end{bmatrix} \]

    Ми можемо знайти значення ймовірності на її максимумі, обчисливши L (x n r | a, R, C), використовуючи упр. 5.4 та процедуру оптимізації для пошуку MLE.

    Крім того, можна розрахувати це рішення MLE безпосередньо. Рівняння для оцінки $\ hat {\ mathbf {a}} $ (оцінюваний вектор філогенетичних засобів для всіх символів) та $\ hat {\ mathbf {R}} $ (розрахункова еволюційна матриця швидкості) є (Ревелл і Гармон 2008, Гогенлое та Арнольд (2008)):

    (ур. 5,6)

    \[ \hat{\mathbf{a}} = [(\mathbf{1}^\intercal \mathbf{C}^{-1} \mathbf{1})^{-1}(\mathbf{1}^\intercal \mathbf{C}^{-1} \mathbf{X})]^\intercal \]

    (ур. 5,7)

    \[ \hat{\mathbf{R}} = \frac{(\mathbf{X} - \mathbf{1} \mathbf{\hat{a}})^\intercal \mathbf{C}^{-1} (\mathbf{X} - \mathbf{1} \mathbf{\hat{a}})}{n} \]

    Зауважте, що ми використовуємо X для позначення матриці n (види) × r (ознаки) всіх ознак усіх видів. Зверніть увагу на схожість між цими багатовимірними рівняннями (5.6 і 5.7) та їх одноваріантними еквівалентами (рівняння 4.6 та 4.7).