6.2: Трансформація еволюційної дисперсійно-коваріаційної матриці
- Page ID
- 4608
У 1999 році Марк Пейджел представив три статистичні моделі, які дозволяють перевірити, чи відхиляються дані від процесу постійної швидкості, що розвивається на філогенетичному дереві (Pagel 1999a, b) 1. Кожна з цих трьох моделей являє собою статистичне перетворення елементів філогенетичної матриці дисперсії-коваріації C, з якими ми вперше зіткнулися в главі 3. Всі три також можна розглядати як перетворення довжин гілок дерева, що додає більш інтуїтивне розуміння статистичних властивостей перетворень дерева (рис. 6.1). Ми можемо трансформувати дерево, а потім імітувати символи під броунівською моделлю руху на перетвореному дереві, створюючи зовсім інші візерунки, ніж якби вони були змодельовані на початковому дереві.

Існує три перетворення дерева Пегеля (лямбда: λ, дельта: δ та каппа:). Я опишу кожен з них разом з поширеними методами підгонки моделей Pagel під ML, AIC і байєсівські фреймворки. Три перетворення Пейджела також можуть бути пов'язані з еволюційними процесами, хоча ці відносини іноді розпливчасті порівняно з підходами, заснованими на явних еволюційних моделями, а не перетвореннях дерев (див. Нижче для отримання додаткових коментарів щодо цієї відмінності).
Мабуть, найбільш часто використовуваним перетворенням дерева Пегеля є λ. При використанні λ всі недіагональні елементи філогенетичної дисперсійно-коваріаційної матриці множать на значення λ, обмежене значеннями 0 ≤ λ ≤ 1. Діагональні елементи залишаються незмінними. Отже, якщо вихідна матриця для r видів дорівнює:
\[ \mathbf{C_o} = \begin{bmatrix} \sigma_1^2 & \sigma_{12} & \dots & \sigma_{1r}\\ \sigma_{21} & \sigma_2^2 & \dots & \sigma_{2r}\\ \vdots & \vdots & \ddots & \vdots\\ \sigma_{r1} & \sigma_{r2} & \dots & \sigma_{r}^2\\ \end{bmatrix} \label{6.1}\]
Тоді перетворена матриця буде такою:
\[ \mathbf{C_\lambda} = \begin{bmatrix} \sigma_1^2 & \lambda \cdot \sigma_{12} & \dots & \lambda \cdot \sigma_{1r}\\ \lambda \cdot \sigma_{21} & \sigma_2^2 & \dots & \lambda \cdot \sigma_{2r}\\ \vdots & \vdots & \ddots & \vdots\\ \lambda \cdot \sigma_{r1} & \lambda \cdot \sigma_{r2} & \dots & \sigma_{r}^2\\ \end{bmatrix} \label{6.2}\]
З точки зору перетворень довжини гілки λ стискає внутрішні гілки, залишаючи при цьому верхівки гілок дерева незачепленими (рис. 6.1). λ може варіюватися від 1 (без перетворення) до 0 (що призводить до повної зіркової філогенії, при цьому всі гілки верхівки рівні по довжині і всі внутрішні гілки довжиною 0). Можна в принципі використовувати деякі значення λ більше одного на більшості матриць дисперсії-коваріації, хоча багато значень λ > 1 призводять до матриць, які не є дійсними матрицями дисперсії-коваріації та/або не відповідають жодному філогенетичному перетворенню дерева. З цієї причини я рекомендую λ обмежуватися значеннями між 0 і 1.
λ часто використовується для вимірювання «філогенетичного сигналу» в порівняльних даних. Це має інтуїтивний сенс, оскільки λ масштабує дерево між моделлю постійних швидкостей (λ = 1) до тієї, де кожен вид статистично незалежний від будь-яких інших видів дерева (λ = 0). Статистично це може бути дуже корисна інформація. Однак існує певна небезпека в тому, щоб віднести статистичний результат - або філогенетичний сигнал, чи ні - до якогось конкретного біологічного процесу. Наприклад, філогенетичний сигнал іноді називають «філогенетичним обмеженням». Але одним із способів отримання високого філогенетичного сигналу (λ поблизу 1) є еволюція рис під броунівською моделлю руху, яка передбачає абсолютно невимушену еволюцію характеру. Так само відсутність філогенетичного сигналу - який можна назвати «низьким філогенетичним обмеженням» - є результатом моделі OU з високим параметром α (див. Нижче), яка є моделлю, де еволюція ознак далеко від оптимального значення, насправді, дуже обмежена. Ревелл та ін. (2008) показати широкий спектр обставин, які можуть призвести до закономірностей високого або низького філогенетичного сигналу, і обережність проти надмірної інтерпретації результатів аналізу філогенетичного сигналу, як λ Пегеля. Також варто зазначити, що статистичні оцінки λ при моделі ML, як правило, кластеризовані поблизу 0 і 1 незалежно від істинного значення, і вибір моделі AIC може, як правило, віддавати перевагу моделям з λ ≠ 0 навіть тоді, коли дані моделюються під броунівським рухом (Boettiger et al. 2012).
δ Пагела призначений для захоплення зміни темпів еволюції через час. При δ перетворенні всі елементи філогенетичної дисперсійно-коваріаційної матриці піднімаються до степені δ, приймається позитивною. Отже, якщо наша вихідна матриця C дана вище (рівняння 6.1), то δ -перетворений варіант буде таким:
\[ \mathbf{C_\delta} = \begin{bmatrix} (\sigma_1^2)^\delta & (\sigma_{12})^\delta & \dots & (\sigma_{1r})^\delta\\ (\sigma_{21})^\delta & (\sigma_2^2)^\delta & \dots & (\sigma_{2r})^\delta\\ \vdots & \vdots & \ddots & \vdots\\ (\sigma_{r1})^\delta & (\sigma_{r2})^\delta & \dots & (\sigma_{r}^2)^\delta\\ \end{bmatrix} \label{6.3} \]
Оскільки ці елементи представляють висоти вузлів у філогенетичному дереві, то δ також можна розглядати як трансформацію висот філогенетичних вузлів. Коли δ дорівнює одиниці, дерево незмінне і одне все ще має постійну швидкість броунівського руху; коли δ менше 1, висоти вузлів зменшуються, але більш глибокі гілки в дереві зменшуються менше, ніж більш дрібні гілки (рис. 6.1). Це ефективно являє собою модель, де швидкість еволюції сповільнюється через час. На відміну від цього, δ > 1 розтягує більш дрібні гілки в дереві більше, ніж глибокі гілки, імітуючи модель, де швидкість еволюції прискорюється через час. Існує тісний зв'язок між моделлю δ, моделлю ACDC (Blomberg et al. 2003) та Harmon et al. (2010) ранньою моделлю вибуху [див. Також Uyeda and Harmon (2014), особливо додаток).
Нарешті, перетворення іноді використовується для захоплення закономірностей «спеціальних» змін у деревах. У моделі піднімається всі довжини гілок у дереві силою (ми вимагаємо, щоб ≥ 0). Це має складний вплив на філогенетичну матрицю дисперсії-коваріації, оскільки вплив цього перетворення на кожен елемент коваріації залежить як від значення, так і від кількості гілок, що простягаються від кореня дерева до останнього спільного предка кожної пари види. Отже, якщо наша вихідна матриця C задана Equation\ ref {6.1}, перетворена версія буде такою:
\[ \begin{array}{l} \mathbf{C_o} = \\ \left(\begin{smallmatrix} b_{1,1}^k + b_{1,2}^k \dots + b_{1,d_1}^k & b_{1-2,1}^k + b_{1-2,2}^k \dots + b_{1-2,d_{1-2}}^k & \dots & b_{1-r,1}^k + b_{1-r,2}^k \dots + b_{1-r,d_{1-r}}^k \\ b_{2-1,1}^k + b_{2-1,2}^k \dots + b_{2-1,d_{1-2}}^k & b_{2,1}^k + b_{2,2}^k \dots + b_{2,d_2}^k & \dots & b_{2-r,1}^k + b_{2-r,2}^k \dots + b_{2-r,d_{2-r}}^k \\ \vdots & \vdots & \ddots & \vdots\\ b_{r-1,1}^k + b_{r-1,2}^k \dots + b_{r-1,d_{1-r}}^k & b_{r-2,1}^k + b_{r-2,2}^k \dots + b_{r-2,d_{1-2}}^k & \dots & b_{r,1}^k + b_{r,2}^k \dots + b_{r,d_{r}}^k \\ \end{smallmatrix}\right) \\ \end{array} \label{6.4} \]
де b x, y - довжина гілки, яка є останнім загальним предком таксонів x і y, тоді як d x, y - загальна кількість гілок, з якими стикається проходження шляху від кореня до останнього спільного предка видової пари, заданої x, y (або до кінчика x, якщо вказано лише один таксон). Зайве говорити, що це перетворення легше зрозуміти як перетворення самих гілок дерев, а не пов'язаної матриці дисперсії-коваріації.
Коли параметр один, дерево залишається незмінним, і одне все ще має броунівський процес руху з постійною швидкістю; коли = 0, всі довжини гілок одна. значення між цими двома крайностями представляють проміжні продукти (рис. 6.1). часто інтерпретується з точки зору моделі, де зміна характеру більш-менш зосереджена на подіях видоутворення. Щоб це тлумачення було дійсним, ми повинні припустити, що філогенетичне дерево, як дано, включає всі (або навіть більшість) подій видоутворення в історії кладу. Проблема з цим припущенням полягає в тому, що події видоутворення майже напевно відсутні через відбір проб: можливо, деякі живі види з клади не були відібрані, або види, що входять до складу клади, вимерли до сьогоднішнього дня і, таким чином, не відбираються. Існують набагато кращі способи оцінки спеціальних моделей, які можуть враховувати ці проблеми при вибірці (наприклад, Bokma 2008; Goldberg and Igić 2012); ці новіші методи слід віддати перевагу перед Pagel's для тестування на спеціальну модель в даних ознак.
Існує два основних способи оцінки відповідності трьох моделей стилю Пейджеля до даних. По-перше, можна використовувати ML для оцінки параметрів та тестів коефіцієнта ймовірності (або оцінки A I C) для порівняння відповідності різних моделей. Кожен з них являє собою модель з трьох параметрів: один додатковий параметр доданий до двох параметрів, вже необхідних для опису одношвидкісного броунівського руху. Як згадувалося вище, імітаційні дослідження припускають, що це іноді може призвести до надмірної впевненості, принаймні для моделі λ. Іноді дослідники порівнюють відповідність певної моделі (наприклад, λ) з моделями, де цей параметр фіксується на двох екстремальних значеннях (0 або 1; це неможливо з δ). По-друге, можна використовувати методи Байєса для оцінки задніх розподілів значень параметрів, а потім перевірити ці розподіли, щоб побачити, чи перетинаються вони з цікавими значеннями (скажімо, 0 або 1).
Ми можемо застосувати ці три моделі Пейджела до даних розміру тіла ссавців, розглянутих у розділі 5, порівнюючи оцінки A I C для броунівського руху з оцінками трьох перетворень. Отримуємо наступні результати:
Модель | Оцінки параметрів | лНЛ | А І С |
---|---|---|---|
Броунівський рух | σ 2 = 0,088, θ = 4,64 | -78.0 | 160.4 |
лямбда | σ 2 = 0,085, θ = 4,64, λ = 1,0 | -78.0 | 162.6 |
дельта | σ 2 = 0,063, θ = 4,60, δ = 1,5 | -77.7 | 162.0 |
каппа | σ 2 = 0,170, θ = 4,64, = 0,66 | -77.3 | 161.1 |
Зверніть увагу, що броунівський рух є кращою моделлю з найнижчим показником A I C, але також, що всі чотири оцінки A I C C знаходяться в межах 3 одиниць - це означає, що ми не можемо легко розрізняють серед них, використовуючи дані наших ссавців.