7.2: Моделювання еволюції дискретних станів
- Page ID
- 4877
Поки що ми мали справу лише з постійно мінливими персонажами. Однак багато персонажів, що цікавлять біологів, найкраще визначати як символи з встановленою кількістю фіксованих станів. Для безкінцівки у скваматів кожен вид або безногий (стан 0), або ні (стан 1; насправді, є деякі види, які можна вважати «проміжними» Brandley et al. 2008, але ми будемо ігнорувати їх поки що). У нас можуть виникнути особливі питання щодо еволюції безкінцівки у скваматів. Наприклад, скільки разів цей персонаж змінювався в еволюційній історії скваматів? Як часто розвивається безкінцівність? Чи коли-небудь кінцівки знову еволюціонують? Чи пов'язана еволюція безкінцівки з якимось іншим аспектом життя цих плазунів?
Ми розглянемо дискретні символи, де кожен вид може проявляти один з k станів. (У наведеному вище прикладі без кінцівок k = 2). Для символів з більш ніж двома станами існує ключова відмінність між впорядкованими та неупорядкованими символами. Впорядковані символи можуть бути розміщені в такому порядку, щоб переходи відбувалися лише між сусідніми станами. Наприклад, я міг би включити «проміжні» види, які знаходяться десь між кінцівками та безкінцівками — наприклад, «русалки скінки» (Sirenoscincus) з Мадагаскару, так звані тому, що їм не вистачає задніх кінцівок (рис. 7.2, Moch and Senter 2011). Впорядкована модель може дозволити лише переходи між кінцівками та проміжними, а також проміжними та кінцівками; за такою моделлю було б неможливо перейти безпосередньо від кінцівок до безкінцівок, не ставши спочатку проміжною. Для невпорядкованих символів будь-який стан може змінитися в будь-який інший стан. У цьому розділі я зосереджуся в основному на невпорядкованих символах; ми повернемося до впорядкованих символів пізніше в книзі.

Більшість робіт з еволюції дискретних символів на філогенетичних деревах зосереджені на еволюції генних або білкових послідовностей. Послідовності генів складаються з чотирьох станів символів (A, C, T і G для ДНК). Моделі еволюції послідовності дозволяють переходити між усіма цими станами з певною швидкістю і можуть дозволити швидкості переходу варіюватися в залежності від сайтів, між кладами або через час. Існує величезна кількість названих моделей, які були застосовані до цієї проблеми (наприклад, Jukes-Cantor, JC; General Time Reversible, GTR; і багато іншого, Yang 2006), і ряд статистичних підходів доступні для відповідності цих моделей до даних (наприклад, Posada 2008).
Будь-який дискретний характер може бути змодельований аналогічно послідовності генів. При розгляді фенотипічних ознак слід мати на увазі дві основні відмінності від аналізу послідовностей ДНК. По-перше, довільні дискретні символи можуть мати будь-яку кількість станів (крім чотирьох, пов'язаних з даними послідовності ДНК). По-друге, символи, як правило, аналізуються самостійно, а не об'єднують довгі набори символів і припускають, що вони поділяють одну і ту ж модель змін.