Skip to main content
LibreTexts - Ukrayinska

11.5: Моделі вибірки та народження-смерті

  • Page ID
    4834
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Важливо подумати про вибірку при підгонці моделей народження-смерті до філогенетичних дерев. Якщо будь-які види відсутні у вашому філогенетичному дереві, вони призведуть до упереджених оцінок параметрів. Це пов'язано з тим, що відсутні види непропорційно ймовірно з'єднуються з деревом на коротких, а не довгих гілках. Якщо ми випадковим чином відбираємо лінії з дерева, ми в кінцевому підсумку погано недооцінюємо як видоутворення, так і вимирання (і помилково виводячи уповільнення; див. Розділ 12).

    На щастя, математика для неповного вибірки реконструйованих філогенетичних дерев також була розроблена. Існує два способи зробити це, залежно від того, як дерево насправді відібрано. Якщо вважати відсутні види випадковими по відношенню до таксонів, включених в дерево, то для їх обліку можна використовувати рівномірну фракцію вибірки. На відміну від цього, ми часто перебуваємо в ситуації, коли у нас на дереві є кінчики, які є поодинокими представниками різноманітних кладів (наприклад, пологів). Ми зазвичай знаємо різноманітність цих невибіркових кладів у нашому дереві представників. Я буду слідувати (Höhna et al. 2011; Höhna 2014) і посилатися на цей підхід як репрезентативний вибірка (і попередня альтернатива як рівномірний вибірка).

    Для рівномірного підходу вибірки ми використовуємо рамки вище обчислення назад через час, але модифікуємо початкові точки для кожного кінчика в дереві, щоб відобразити f, ймовірність вибірки виду (після Fitzjohn et al. (2009)):

    (ур. 11,22)

    D N (0) =1 − ф

    Е (0) = ф

    Повторюючи розрахунки вище уздовж гілок і на вузлах, але з вищевказаними стартовими умовами отримаємо наступну ймовірність (FitzJohn et al. 2009):

    (ур. 11,23)

    \[ \begin{aligned} L(t_1, t_2, \dots, t_n) = \lambda^{n-1} \big[ \prod_{k = 1}^{2n-2} e^{(\lambda-\mu)(t_{k,b} - t_{k,t})} \cdot \\ \frac{(f \lambda - (\mu - \lambda(1-f))e^{(\lambda - \mu)t_{k,t}})^2}{(f \lambda - (\mu - \lambda(1-f))e^{(\lambda - \mu)t_{k,b}})^2} \big] \end{aligned} \]

    Знову ж таки, вищевказана формула пропорційна повній ймовірності, яка становить:

    (ур. 11,24)

    \[ L(\tau) = (n-1)! \frac{\lambda^{n-2} \big[ \prod_{k = 1}^{2n-2} e^{(\lambda-\mu)(t_{k,b} - t_{k,t})} \cdot \frac{(f \lambda - (\mu - \lambda(1-f))e^{(\lambda - \mu)t_{k,t}})^2}{(f \lambda - (\mu - \lambda(1-f))e^{(\lambda - \mu)t_{k,b}})^2} \big]}{[1-E(t_{root})]^2} \]

    і:

    (ур. 11,25)

    \[ E(t_{root}) = 1 - \frac{\lambda-\mu}{\lambda - (\lambda-\mu)e^{(\lambda - \mu)t_{root}}} \]

    Для репрезентативної вибірки один підхід полягає у розгляді даних як розділених на дві частини, філогенетичні та таксономічні. Таксономічна частина - це вік стовбура та існуюча різноманітність невибіркових кладів, тоді як філогенетична частина - це відносини між цими кладами. Слідом за Rabosky і Lovette (2007) ми можемо обчислити:

    (ур. 11,26)

    Л т о т а л = Л р ч у л о г е н е т і cЛ т а х о н о м и с

    Де L p h y l o g e n e t i c можна обчислити за допомогою рівняння 11.18 і L t a x o n o m i c обчислюється для кожного кладу за допомогою рівняння 10.16, а потім множиться, щоб отримати загальну ймовірність.

    Є два розширення цього підходу, про які варто згадати. Одним з них є диверсифікована модель вибірки («DS») Hohna (2011). Ця модель робить інше припущення: при вибірці n таксонів із загальної множини m були включені найглибші n − 1 вузли. Підхід Hohna дозволяє користувачам відповідати моделі з репрезентативною вибіркою, але не вимагаючи призначення існуючої різноманітності для кожного класу. Інший підхід, Stadler and Smrckova (2016), обчислює ймовірність репрезентативно відібраних дерев і може відповідати моделям мінливих в часі видових і вимирання швидкостей (див. Розділ 12).