Skip to main content
LibreTexts - Ukrayinska

9.2: Поза моделлю Mk

  • Page ID
    4524
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    У розділі 8 ми розглянули еволюцію дискретних символів на філогенетичних деревах. Ці моделі підпадають під загальну категорію марковських моделей безперервного часу, які розглядають процес, який може займати два і більше станів. Переходи між цими станами відбуваються в безперервному часі. Властивість Маркова означає, що, в якийсь час t, те, що відбувається далі в моделі, залежить тільки від поточного стану процесу, а не від чогось, що прийшло раніше.

    В еволюційній біології найбільш детальна робота над марківськими моделями безперервного часу була зосереджена на даних ДНК або білкової послідовності. Як згадувалося раніше, для моделювання та аналізу цих молекулярних послідовностей доступний надзвичайно великий набір моделей. Можна також докладно розглянути ці моделі, додавши неоднорідність швидкості між сайтами (наприклад, гамма-параметр, як у GTR+ γ), або інші ускладнення, пов'язані з механізмами еволюції послідовностей (огляд див. Liò and Goldman 1998).

    Однак існує дві важливі відмінності між моделями еволюції послідовностей та моделями зміни характеру на деревах, які роблять наше завдання відмінним від завдання моделювання послідовностей ДНК або амінокислот. По-перше, при аналізі молекулярних послідовностей зазвичай мають дані для багатьох тисяч (або мільйонів) символів. Набори даних для інших персонажів, таких як фенотипічні символи видів - зазвичай набагато менші (і їх складніше збирати). По-друге, аналіз послідовності дуже часто передбачає, що кожен символ еволюціонує незалежно від усіх інших символів, але що всі символи (або принаймні певні великі підмножини цих символів) розвиваються за спільною моделлю (Liò and Goldman 1998; Yang 2006). Це означає, що, наприклад, частота переходів між А і С в одному місці в послідовності генів вносить інформацію про один і той же перехід в іншому місці в послідовності.

    На жаль, аналізуючи еволюцію морфологічного характеру, нас часто цікавлять окремі символи, і використання спільних моделей між персонажами здається неможливим виправдати. Зазвичай немає еквівалентності між різними станами символів для різних символів: A - це A для послідовностей, але «1» в символьній матриці зазвичай відповідає наявності двох абсолютно різних символів. Наслідок цієї різниці відбивається в статистичному властивості багатовимірних даних. Для задач послідовності генів додавання більшої кількості даних у вигляді додаткових символів (сайтів) полегшує встановлення моделі, оскільки кожен сайт додає інформацію про загальну (спільну) модель між сайтами. З даними символів додаткові символи не полегшують проблему, оскільки кожен символ має свої параметри моделі. Насправді ми побачимо, що при розгляді кореляцій символів за допомогою узагальненої моделі Mk додавання символів насправді ускладнює проблему. Можливо, ці питання частково пояснюють повільні темпи розробки моделі підгонки дискретних символів до дерев. Є кілька потенційних рішень, таких як порогові моделі [Felsenstein (2005); Felsenstein (2012); обговорюється нижче]. Більше роботи відчайдушно потрібно в цій сфері.

    У цьому розділі ми спочатку обговоримо розширення моделей Mk, які дозволяють нам додати складності цій простій моделі. Ми також обговорюємо порогові моделі, відносно новий підхід у порівняльних методах, який відрізняється від моделей Mk і має певний потенціал для майбутнього розвитку.