Skip to main content
LibreTexts - Ukrayinska

13.5: Потенційні підводні камені та як їх уникнути

  • Page ID
    4695
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Нещодавно було опубліковано кілька статей, критичних щодо залежних від держави моделей диверсифікації (Rabosky and Goldberg 2015, Maddison and FitzJohn (2015)). Ці статті викликають суттєву критику, яку важливо вирішувати при застосуванні методів, описаних у цьому розділі, до емпіричних даних. У цьому розділі я спробую описати критику та їх потенційні засоби правового захисту.

    Найсерйознішим обмеженням державозалежних моделей в даний час є те, що вони розглядають лише відносно невеликий набір можливих моделей. Зокрема, описаний нами вище підхід порівнює дві моделі: по-перше, модель, де народжуваність і смертність є постійними і не залежать від стану характеру; по-друге, модель, де народжуваність і смертність залежать тільки від стану характеру (Maddison et al. 2007). Але є й інша можливість, яка може бути (загалом) більш поширеною, ніж будь-яка з моделей, яку ми розглядаємо: рівень народжуваності та смертності варіюється, але таким чином, який не залежить від конкретного характеру, який ми вибрали для аналізу. Я кажу, що це, мабуть, звичайна закономірність, тому що ми знаємо, що рівень народжуваності та смертності надзвичайно різняться між родами дерева життя (Alfaro et al. 2009), і мені здається ймовірним, що багато наших гіпотез про те, які персонажі можуть сприяти цій варіації, є, на даний момент, колоть в темряві.

    Це питання є нормальним для статистичного аналізу - адже завжди є інші моделі поза нашим набором розглянутих можливостей. Однак у цьому випадку той факт, що залежні від держави моделі диверсифікації не враховують можливості, викладені вище, викликає дуже особливу - і своєрідну - проблему: якщо ми застосовуємо тести до емпіричних філогенетичних дерев, навіть за допомогою вигаданих даних, ми майже завжди знаходимо статистично значущі результати. (Рабоскі і Голдберг 2015). Наприклад, Rabosky and Goldberg (2015) виявили, що дуже часто існує статистично значущий «сигнал» про те, що кількість букв у назві виду значно пов'язана зі швидкістю видоутворення в діапазоні емпіричних наборів даних. Цей результат може здатися смішним і загадковим, оскільки немає ніякого способу, щоб довжина назви видів була пов'язана з процесами диверсифікації. Однак якщо ми повернемося до нашої альтернативної моделі вище, то результати мають сенс. Rabosky and Goldberg (2015) моделювали еволюцію характеру на реальних філогенетичних деревах, і їх результати не тримаються, коли дерева моделюються разом з персонажами (саме тому результати Rabosky і Goldberg (2015) не представляють «помилки типу I», проти їх папір, тому що дані не моделюються під нульовою гіпотезою). На цих реальних деревах показники видоутворення та/або вимирання різняться залежно від кладів. Серед двох моделей, які автори вважають, обидві є неправильними; видоутворення та вимирання не залежать від характеру, але не постійні через час. З двох альтернатив модель, залежна від держави, як правило, підходить краще, оскільки, з статистичної точки зору, важливо, щоб модель фіксувала деякі зміни в народжуваності та смертності в кладах. Навіть випадковий символ підбере частину цієї варіації, так що альтернативна модель, як правило, підходить краще, ніж нульова - хоча, в цьому випадку, персонаж не має нічого спільного з диверсифікацією!

    На щастя, існує ряд способів боротьби з цією проблемою. По-перше, можна порівняти статистичну підтримку моделі, що залежить від стану, з тією підтримкою, яку отримують для випадкових даних. Випадкові дані можуть бути змодельовані на дереві, або можна перемикати кінчики або малювати випадкові дані з багатономіального розподілу (Rabosky and Goldberg 2015). Потім можна порівняти, наприклад, розподіл Δ A I C балів, отриманих з цих перестановок, до Δ A I C c для вихідних даних. Існують також напівпараметричні методи, засновані на перестановках, що володіють схожими статистичними властивостями (Rabosky and Goldberg 2017). Крім того, ми могли б явно розглянути можливість того, що якийсь невимірний характер насправді є тим, що впливає на показники диверсифікації (Beaulieu and O'Meara 2016). Цей останній підхід є найбільш елегантним, оскільки ми можемо безпосередньо додати модель, описану в цьому розділі, до нашого списку кандидатів (див. Beaulieu and O'Meara 2016).

    Більш загальну критику залежних від держави моделей диверсифікації підняли Меддісон і Фіцджон (Maddison and FitzJohn 2015). У цій роботі зазначено, що статистично значущі результати цих тестів можуть бути викликані подією на одній гілці дерева і, отже, бути неповтореними. Це хороша критика, яка однаково добре відноситься до ряду порівняльних методів. Ми можемо впоратися з цією критикою, частково, переконавшись, що події, які ми тестуємо, тиражуються в наших даних. Разом обидві ці критики аргументують посилення набору підходів до адекватності моделей у порівняльних методах.