Skip to main content
LibreTexts - Ukrayinska

2: Підгонка статистичних моделей до даних

  • Page ID
    4252
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Цей текст про побудову та тестування математичних моделей еволюції. На мій погляд, найкращі порівняльні підходи мають дві особливості. По-перше, найбільш корисні методи підкреслюють оцінку параметрів над тестовою статистикою та P-значеннями. Ідеальні методи підходять до моделей, про які ми дбаємо і оцінюємо параметри, які мають чітку біологічну інтерпретацію. Щоб бути корисними, методи також повинні розпізнавати та кількісно оцінювати невизначеність у наших оцінках параметрів. По-друге, багато корисних методів передбачають вибір моделі, процес використання даних для об'єктивного вибору найкращої моделі з набору можливостей. Коли ми використовуємо підхід до вибору моделі, ми використовуємо той факт, що закономірності в емпіричних наборах даних відкидають деякі моделі як неправдоподібні та підтримують прогнози інших. Такий підхід може бути хорошим способом зв'язати результати статистичного аналізу з певним біологічним питанням.

    • 2.1: Вступ
      Еволюція - це продукт тисячі історій. Окремі організми народжуються, розмножуються і гинуть. Результатом цих індивідуальних життєвих історій на широких проміжках часу є еволюція. На перший погляд може здатися неможливим моделювання цього процесу протягом більш ніж одного-двох поколінь. І все ж науковий прогрес спирається на створення простих моделей і протистояння їм даними. Як ми можемо оцінити моделі, які розглядають еволюцію протягом мільйонів поколінь?
    • 2.2: Стандартне статистичне тестування гіпотез
      Стандартні підходи до тестування гіпотез майже повністю зосереджені на відкиданні нульових гіпотез. У рамках (зазвичай називають частотним підходом до статистики) спочатку визначається нульова гіпотеза. Ця нульова гіпотеза представляє ваше очікування, якщо якогось закономірності, наприклад, різниці між групами, немає, або якщо якийсь цікавий процес не відбувся.
    • 2.3: Максимальна вірогідність
      Імовірність визначається як ймовірність, задана моделлю і набором значень параметрів, отримання певного набору даних. Тобто, враховуючи математичний опис світу, яка ймовірність того, що ми побачимо фактичні дані, які ми зібрали? Щоб розрахувати ймовірність, ми повинні розглянути конкретну модель, яка, можливо, породила дані. Ця модель майже завжди матиме значення параметрів, які потрібно вказати. Ми можемо посилатися на цю зазначену модель як гіпотезу, H.
    • 2.4: Байєсова статистика
      Останніми роками спостерігається величезне зростання байєсівських підходів у реконструкції філогенетичних дерев та оцінці довжини їх гілок. Хоча в даний час існує лише кілька байєсівських порівняльних методів, їх кількість неодмінно зросте, оскільки порівняльні біологи намагаються вирішити більш складні проблеми.
    • 2.5: AIC проти Байєса
      Коли ви порівнюєте фактори Байєса, ви припускаєте, що одна з моделей, яку ви розглядаєте, насправді є справжньою моделлю, яка генерувала ваші дані, і обчислюєте задні ймовірності на основі цього припущення. Навпаки, AIC передбачає, що реальність складніша, ніж будь-яка з ваших моделей, і ви намагаєтеся визначити модель, яка найбільш ефективно фіксує інформацію у ваших даних. Тож навіть незважаючи на те, що обидві техніки здійснюють вибір моделі, основна філософія того, як ці моделі відрізняються.
    • 2.6: Моделі та порівняльні методи
      Однією з тем у книзі є те, що я підкреслюю пристосування моделей до даних та оцінювання параметрів. Вважаю, що такий підхід дуже корисний для майбутнього галузі порівняльної статистики з трьох основних причин. По-перше, він гнучкий; можна легко порівняти широкий спектр конкуруючих моделей з вашими даними. По-друге, він розширюється; можна створювати нові моделі та автоматично вписувати їх у існуючу структуру для аналізу даних. Нарешті, він потужний.
    • 2.S: Підгонка статистичних моделей до даних (резюме)