8.5: Вивчення Мк - тест «загального сміття»
- Page ID
- 4742
Одна проблема, яка виникає іноді в оптимізації максимальної ймовірності, трапляється, коли замість піку поверхня ймовірності має довгий плоский «гребінь» однаково ймовірних значень параметрів. У випадку з моделлю Mk прийнято виявляти, що всі значення q більше певного значення мають однакову ймовірність. Це тому, що вище певної швидкості еволюція була настільки швидкою, що всі сліди історії еволюції цього персонажа були знищені. Після цього стану характеру кожного роду є випадковими і не мають ніякого відношення до форми філогенетичного дерева. Наші методи оптимізації в цьому випадку не працюватимуть, оскільки немає значення q, яке має більшу ймовірність, ніж інші значення. Як тільки ми потрапляємо на хребет, всі значення q мають однакову ймовірність.
Для моделей Mk існує простий тест, який дозволяє нам розпізнати, коли поверхня ймовірності має довгий гребінь, а значення q неможливо оцінити. Мені подобається називати цей тест тестом «загальне сміття», оскільки він може сказати вам, чи є ваші дані «сміттям» стосовно історичного висновку - тобто ваші дані не мають інформації про історичні закономірності зміни ознак. Можна передбачити держави так само добре, вибираючи кожен вид навмання.
Щоб провести загальний тест сміття, уявіть, що ви просто малюєте значення ознак навмання. Тобто кожен вид має певну ймовірність p мати характер стану 0 і деяку ймовірність (1 − p) стану 1 (можна також узагальнити цей тест до багатостанових моделей). Цю ймовірність легко записати. Для дерева розміром\(n\) ймовірність малювання n 0 видів зі станом 0 дорівнює:
\[L_{garbage} = p^{n_0}(1 − p)^{n − n_0} \label{8.2}\]
Це рівняння дає ймовірність створення моделі «загального сміття» для будь-якого значення p. Рівняння 8.1 пов'язане з біноміальним розподілом (не вистачає лише факторіального члена). З теорії ймовірностей ми також знаємо, що оцінка ML p дорівнює n 0/n, з ймовірністю, заданою вищевказаною формулою.
Тепер розглянемо поверхню ймовірності моделі Мк. Коли поверхні ймовірності Mk мають довгі хребти, вони майже завжди для високих значень q - і коли швидкість переходу змін символів висока, ця модель сходиться до нашої моделі «малювання з капелюха» (або «сміття»). Коник правдоподібності лежить на величині, яка точно взята з рівняння 8.10 вище.
Таким чином, можна порівняти ймовірність нашої моделі Mk з загальною моделлю сміття. Якщо максимальне значення ймовірності q має таку ж ймовірність, що і наша сміттєва модель, то ми знаємо, що ми знаходимося на гребені поверхні ймовірності і q неможливо оцінити. Ми також не маємо можливості робити жодних тверджень про минулу еволюцію нашого персонажа — зокрема, ми не можемо оцінити стан родового характеру з будь-якою точністю. На відміну від цього, якщо ймовірність моделі Мк більше загальної сміттєвої моделі, то наші дані містять деяку історичну інформацію. Ми також можемо зробити це порівняння за допомогою AIC, враховуючи загальну модель сміття як єдиний параметр p.
Для скваматів маємо n = 258 і n 0 = 207. Обчислюємо р = n 0/n = 207/258 = 0,8023256. Тож ймовірність нашої сміттєвої моделі є
Л г а р б а г е = р п 0 (1 − р) n − n 0 = 0,8023256 207 (1 − 0,8023256) 51 = 1,968142 е − 56.
Цей розрахунок є і простішим, і кориснішим, хоча, в натуральному масштабі журналу:
л н Л г а р б а г е = n 0 ⋅ л н (р) + (n − n 0) ⋅ l n (1 − р) =207 ⋅ л п (0.8023256) +51 ⋅ л n (1 − 0.8023256) = − 128.2677.
Порівняйте це з ймовірністю журналу нашої моделі Mk, l n L = −80.487176, і ви побачите, що сміттєва модель жахливо підходить до цих даних. Насправді в наших даних є деякі історичні відомості про особливості видів.