10.5: Топологія дерева, форма дерева та баланс дерева за моделлю народження-смерті
- Page ID
- 4286
Топологія дерева узагальнює закономірності еволюційної спорідненості серед групи видів, незалежних від довжини гілок філогенетичного дерева. Два різних дерева мають однакову топологію, якщо вони визначають однаковий набір кладів. Це важливо, оскільки іноді два дерева можуть виглядати дуже по-різному, але все ще мають однакову топологію (наприклад, рис. 10.6 A, B та C).
Форма дерева ігнорує як довжину гілок, так і мітки кінчиків дерева. Наприклад, два дерева на малюнку 10.7 A та B мають однакову форму дерева, хоча вони не мають спільних порад. Те, що вони поділяють, полягає в тому, що їх вузли мають однакові закономірності з точки зору кількості нащадків на кожній «стороні» біфуркації. На відміну від цього, філогенетическое дерево в 10,7 С має різну форму. (Зауважте, що те, що я називаю формою дерева, іноді називають «немаркованою» топологією дерева; наприклад, Felsenstein 2004).
Нарешті, баланс дерев - це спосіб вираження відмінностей у кількості нащадків між парами сестринських родовищ у різних точках філогенетичного дерева. Для прикладу розглянемо філогенетическое дерево, зображене на малюнку 10.7Б. Найглибший розкол в цьому дереві відокремлює кладу з п'ятьма видами (форель, бегемот, синя сойка, барвінок равлик, скляний кальмар) від клади з одним видом (гриб шиітаке), і так, щоб вузол в дереві був незбалансований з (5, 1) малюнком. На відміну від цього, найглибший розкол в 10.7C розділяє два клади однакового розміру. У цьому дереві найглибший вузол врівноважений візерунком (3, 3). Ряд підходів у макроеволюції використовує баланс у вузлах і по цілих деревах, щоб спробувати захопити важливі еволюційні закономірності.
Ми можемо почати розуміти ці підходи з розгляду балансу одного вузла n у філогенетичному дереві. Є два клади, що зійшли з цього вузла; назвемо їх a і b. Припустимо, що загальна кількість видів, що зійшли з вузла N t o t a l = N a + N b, є постійною і що ні N а ні N b дорівнює нулю. Важливим результатом, вперше обговорюваним Фаррісом (1976) для моделі чистого народження, є те, що всі можливі числові поділи N t o t a l на N a + N b однаково вірогідні. Наприклад, якщо N t o t a l = 10, то всі можливі ділення: 1 + 9, 2 + 8, 3 + 7, 4 + 6, 5 + 5, 6 + 4, 7 + 3, 8 + 2 і 9 + 1 однаково вірогідні, так що кожен буде прогнозований відбуватися з ймовірністю 1/9. Формально,
\[ p(N_a \mid N_{total})=\frac{1}{N_{total}-1} \label{19.17}\]
Зверніть увагу, що існує тонка різниця між рівнянням 10.2 вище та деякими рівняннями в літературі, наприклад, Slowinski та Guyer (1993). Ця різниця пов'язана з тим, чи ми позначимо два нащадні клади, а і б, чи ні; якщо клади не позначені, то немає різниці між 4+6 і 6+4, так що ймовірність того, що найбільший клад, залежно від того, що він може бути, має 6 видів вдвічі більше, ніж дається моїм рівнянням.
Рівняння 10.17 застосовується, навіть якщо є вимирання, якщо обидва сестринські клади мають однакові показники видоутворення та вимирання (Slowinski and Guyer 1993). Це рівняння було використано для порівняння коефіцієнтів диверсифікації між сестринськими кладами, або для однієї пари, або для декількох пар (див. Розділ 11).
Статистика балансу дерева забезпечує спосіб порівняння чисел таксонів у всіх вузлах філогенетичного дерева одночасно. Існує дивно велика кількість статистики балансу дерева, але всі покладаються на узагальнення інформації про баланс кожного вузла по всьому дереву. Індекс Коллеса I c (Colless 1982) є одним з найпростіших — і, мабуть, найбільш часто використовуваних — індексів балансу дерев. I c - сума різниці в кількості піднесених з кожного боку кожного вузла в дереві підказок, стандартизована по максимуму, якого може досягти така сума:
\[ I_C = \frac{\sum\limits_{all nodes} (N_L - N_R)}{(N-1)(N-2)/2} \label{10.18}\]
Якщо дерево ідеально збалансоване (можливо тільки тоді, коли N - це якась потужність 2, наприклад 2, 4, 8, 16 і т.д.), то I C = 0 (рис. 10.7C). На відміну від цього, якщо дерево повністю пектинат, це означає, що кожен розкол в дереві контрастує кладку з 1 видом з іншими видами в кладі, то I C = 1 (рис. 10.7А). Всі філогенетичні дерева мають значення I C між 0 і 1 (рис. 10.7B).
Існує ряд інших показників філогенетичного балансу дерева (розглянуто в Mooers and Heard 1997). Всі ці індекси використовуються подібним чином: потім можна порівняти значення індексу дерева з тим, що можна очікувати за певною моделлю диверсифікації, як правило, народження-смерть. Насправді, оскільки ці індекси зосереджені на топології дерева та ігнорують довжини гілок, можна фактично розглянути їх загальну поведінку під набором рівних ставок Маркова (ERM) моделей. Цей набір включає будь-яку модель, де рівень народжуваності та смертності однаковий у всіх лініях філогенетичного дерева в певний час. Моделі ERM включають моделі народження-смерті, як описано вище, але також охоплюють моделі, де рівень народжуваності та/або смертності змінюється з часом.