2.5: AIC проти Байєса
- Page ID
- 4265
Перш ніж завершити цей розділ, я хочу виділити ще одну відмінність у тому, як підходи A I C та Bayes стосуються складності моделі. Це стосується тонкої філософської відмінності, яка є суперечливою серед самих статистиків, тому я лише намалюю основний момент; побачити справжню книгу статистики, як Бернем і Андерсон (2003) або Gelman et al. (2013) для отримання додаткової інформації. Коли ви порівнюєте фактори Байєса, ви припускаєте, що одна з моделей, яку ви розглядаєте, насправді є справжньою моделлю, яка генерувала ваші дані, і обчислюєте задні ймовірності на основі цього припущення. На відміну від цього, A I C передбачає, що реальність складніша, ніж будь-яка з ваших моделей, і ви намагаєтеся визначити модель, яка найбільш ефективно фіксує інформацію у ваших даних. Тобто, незважаючи на те, що обидві техніки здійснюють вибір моделі, основна філософія того, як ці моделі розглядаються, дуже різна: вибір найкращої з декількох спрощених моделей реальності або вибір правильної моделі з набору альтернатив.
Дебати між байєсівськими та імовірнісними підходами часто зосереджуються на використанні попередніх у байєсівській статистиці, але відмінність між моделями та «реальністю» також важлива. Більш конкретно, важко уявити випадок у порівняльній біології, де можна було б виправдати в байєсівському припущенні, що людина визначила справжню модель, яка генерувала дані. Це також пояснює, чому підходи на основі A I C зазвичай вибирають більш складні моделі, ніж байєсівські підходи. У рамках A I C можна припустити, що реальність дуже складна і що моделі є наближеннями; мета полягає в тому, щоб з'ясувати, скільки додаткової складності моделі потрібно для ефективного пояснення даних. У випадках, коли дані фактично генеруються за дуже простою моделлю, A I C може помилитися на користь надмірно складних моделей. На відміну від цього, байєсівські аналізи припускають, що одна з розглянутих моделей є правильною. Цей тип аналізу зазвичай поводиться належним чином, коли дані генеруються за простою моделлю, але може бути непередбачуваним, коли дані генеруються процесами, які не розглядаються жодною з моделей. Однак байєсівські методи пояснюють невизначеність набагато краще, ніж методи АПК, а невизначеність є фундаментальним аспектом філогенетичних порівняльних методів.
Підсумовуючи, Байєсівські підходи є корисними інструментами для порівняльної біології, особливо в поєднанні з обчислювальними методами MCMC. Вони вимагають специфікації попереднього розподілу і припускають, що «справжня» модель є однією з тих, що розглядаються, обидві з яких можуть бути недоліками в деяких ситуаціях. Байєсівські рамки також дозволяють нам набагато легше враховувати філогенетичну невизначеність у порівняльному аналізі. Багато порівняльні біологи прагматичні, і використовують будь-які доступні методи для аналізу своїх даних. Це розумний підхід, але слід пам'ятати про припущення, які лежать в основі будь-якого статистичного результату.