1.3: Короткий вступ до філогенетичних дерев
- Page ID
- 4387
Це важка робота по реконструкції філогенетичного дерева. Цей момент робився багато разів (наприклад, див. Felsenstein 2004), але ведмеді повторюють тут. Існує величезна кількість способів зв'язати набір видів філогенетичним деревом - і кількість можливих дерев зростає надзвичайно швидко з кількістю видів. Наприклад, існує близько 5 × 10 38 способів побудови філогенетичного дерева 1 з 30 видів, що у багато разів перевищує кількість зірок у Всесвіті. Крім того, математична задача оптимального відновлення дерев за ознаками видів є прикладом проблеми, яка є «NP-повною», класом задач, що включають деякі з найбільш обчислювально-складних у світі. Побудувати філогенії складно.
Складність побудови філогеній в даний час відображається в виклику реконструкції дерева життя. Деякі частини дерева життя все ще не вирішені навіть з величезною кількістю геномних даних, які зараз доступні. Відповідно, вчені присвятили цілеспрямовані зусилля вирішенню цієї непростої проблеми. Зараз існує велика кількість швидких та ефективних комп'ютерних програм, спрямованих виключно на реконструкцію філогенетичних дерев (наприклад, MrBayes: Ronquist and Huelsenbeck 2003; BEAST: Drummond and Rambaut 2007). Отже, кількість добре вирішених філогенетичних дерев також швидко зростає. Коли ми починаємо заповнювати прогалини дерева життя, ми розвиваємо набагато чіткіше уявлення про закономірності еволюції, які відбулися за останні 4,5 мільярда років на Землі.
Основна причина того, що філогенетичні дерева важко реконструювати, полягає в тому, що вони багаті інформацією 2. Одне дерево містить детальну інформацію про закономірності та терміни еволюційного розгалуження подій через історію групи. Кожна гілка дерева розповідає нам про спільне походження клади видів, а час початку, час закінчення та довжина гілки говорять нам про терміни видоутворення подій у минулому. Якщо поєднати філогенетичне дерево з деякими ознаками - наприклад, середній розмір тіла для кожного виду в роду ссавців - то ми можемо отримати ще більше інформації про еволюційну історію розділу дерева життя.
Найбільш поширені методи реконструкції філогенетичних дерев використовують дані про гени та/або ознаки видів. Основна інформація про філогенетичну спорідненість видів переноситься в спільних похідних персонажах; тобто персонажах, які еволюціонували нові стани, які поділяються між усіма видами в кладі і не зустрічаються у близьких родичів цієї клади. Наприклад, ссавці мають багато спільних похідних символів, включаючи волосся, молочні залози та спеціалізовані кістки внутрішнього вуха.
Філогенетичні дерева часто будуються на основі генетичних (або геномних) даних з використанням сучасних комп'ютерних алгоритмів. Для побудови дерев можна використовувати кілька методів, таких як парсимонія, максимальна ймовірність та байєсівський аналіз (див. Розділ 2). Всі ці методи мають чіткі припущення і можуть давати різні результати. Насправді, навіть у заданих статистичних рамках різні програмні пакети (наприклад, MrBayes і BEAST, згадані вище, обидва байєсівські підходи) можуть дати різні результати для філогенетичного аналізу одних і тих же даних. Подробиці філогенетичної реконструкції дерева виходять за рамки цієї книги. Зацікавлені читачі можуть прочитати «Inferring Phylogenies» (Felsenstein 2004), «Обчислювальна молекулярна еволюція» (Ян 2006), або інші джерела для отримання додаткової інформації.
Для багатьох сучасних порівняльних методів ми приймаємо філогенетичне дерево для групи видів як даність — тобто припускаємо, що дерево відоме без помилок. Це припущення практично ніколи не виправдовується. Існує багато причин, за якими філогенетичні дерева оцінюються з помилкою. Наприклад, оцінити довжину гілок з кількох генів важко, а довжину гілок, яку ми оцінюємо, слід розглядати як невизначену. Як інший приклад, дерева, які показують взаємозв'язок між генами (генні дерева), не завжди збігаються з деревами, які показують взаємозв'язок між видами (видовими деревами). Через це найкращі порівняльні методи визнають, що філогенетичні дерева завжди оцінюються з певною кількістю невизначеності, як з точки зору топології, так і довжини гілок, і включають цю невизначеність в аналіз. Я опишу деякі методи для досягнення цього в наступних розділах.
Як ми розуміємо величезну кількість інформації, що міститься у великих філогенетичних деревах? Визначення «великих» може варіюватися, але у нас вже є дерева з десятками тисяч кінчиків, і я думаю, що ми можемо передбачити дерева з мільйонами наконечників в найближчому майбутньому. Ці дерева занадто великі, щоб зручно вписатися в людський мозок. Сучасні хитрощі для боротьби з деревами - як банки комп'ютерних моніторів або довгі, скотчасті роздруківки - неефективні і не працюватимуть для величезних філогенетичних дерев майбутнього. Потрібні методики, які дозволять взяти великі філогенетичні дерева і витягувати з них корисну інформацію. Ця інформація включає, але не обмежується цим, оцінку темпів видоутворення, вимирання та еволюції ознак; тестування гіпотез про спосіб еволюції в групі; виявлення адаптивних випромінювань, ключових інновацій та інших макроеволюційних пояснень різноманітності; та багато іншого.