Skip to main content
LibreTexts - Ukrayinska

Блок 4B: висновок для відносин

CO-4: Розрізняють різні шкали вимірювань, вибирають відповідні описові та інференційні статистичні методи на основі цих відмінностей та інтерпретують результати.

Цілі навчання

LO 4.20: Класифікуйте ситуацію аналізу даних за участю двох змінних відповідно до «класифікації рольового типу».

Цілі навчання

LO 4.35: Для ситуації аналізу даних, що включає дві змінні, виберіть відповідний метод виводу для вивчення зв'язку між змінними та обґрунтуйте вибір.

Цілі навчання

LO 4.36: Для ситуації аналізу даних, що включає дві змінні, виконайте відповідний метод висновків для вивчення зв'язків між змінними та зробіть правильні висновки в контексті.

ОГЛЯД: Розділ 1 Класифікація рольового типу перед продовженням.

У попередній одиниці ми навчилися виконувати висновок для однієї категоріальної або кількісної змінної у вигляді точкової оцінки, довірчих інтервалів або тестування гіпотез.

Висновок був насправді

  • про частку населення (коли змінна інтересів була категоричною) і
  • про середнє значення популяції (коли змінна інтерес була кількісною).

Наша наступна (і кінцева) мета цього курсу полягає в тому, щоб виконати висновок про відносини між двома змінними в популяції, на основі спостережуваного співвідношення між змінними у вибірці. Ось як виглядає процес:

Велике коло представляє інтереси населення. Нас цікавить, чи є X і Y родинними в популяції. Щоб розібратися в цьому, візьмемо SRS розміром n, представлену меншим колом. Це дані, які ми використовуємо для виконання висновку. Виходячи з спостережуваних даних, чи маємо ми вагомі докази того, що X і Y пов'язані між собою?

Ми зацікавлені у вивченні того, чи існує зв'язок між змінними X і Y в цікавить популяції. Вибираємо випадкову вибірку і збираємо дані по обох змінних з суб'єктів.

Наша мета полягає в тому, щоб визначити, чи дають ці дані достатньо вагомі докази для нас, щоб узагальнити спостережуваний зв'язок у вибірці та зробити висновок (з деяким прийнятним та узгодженим рівнем невизначеності), що відносини між X і Y існує у всій популяції.

Основною формою висновку, яку ми будемо використовувати в цій одиниці, є тестування гіпотез, але ми обговоримо довірчі інтервали як для оцінки невідомих параметрів, що цікавлять, за участю двох змінних, так і як альтернативний спосіб визначення висновку до нашої гіпотези. тест.

Концептуально, для всіх методів виводу, які ми дізнаємося, ми перевіримо деяку форму:

Ho: Немає зв'язку між X і Y

Ха: Існує зв'язок між X і Y

(Ми також обговоримо точкову та інтервальну оцінку, але наша дискусія про ці форми висновку буде оформлена навколо тесту.)

Нагадаємо, що коли ми обговорювали вивчення взаємозв'язку між двома змінними в блоці Exploratory Data Analysis, наша дискусія була обговорена навколо класифікації рольового типу. Ця частина курсу буде структурована точно так само.

Іншими словами, ми розглянемо тестування гіпотез у розділах 3, що відповідають випадкам C→Q, C→C та Q→Q у таблиці нижче.

Будь-який тип пояснювальної змінної можна поєднати з будь-яким типом змінної відповіді. Можливими сполученнями є: Категорична пояснювальна → Категорична відповідь (C → C), Категорична пояснювальна → Кількісна відповідь (C → Q), кількісна пояснювальна → Категорична відповідь (Q → C) та кількісна пояснювальна → Кількісна відповідь (Q → Q).

Нагадаємо, що випадок Q→C не розглядається спеціально в цьому курсі, крім того, що ми можемо досліджувати зв'язок між цими змінними за допомогою тих самих методів, що і випадок C→Q.

Важливо також пам'ятати, що ми дізналися про приховані змінні та причинно-наслідкові зв'язки.

  • Якщо наша пояснювальна змінна була частиною добре розробленого експерименту, то ми можемо претендувати на причинний ефект.
  • Але якщо він базувався на спостережному дослідженні, ми повинні бути обережними, маючи на увазі лише зв'язок або асоціацію між двома змінними, а не прямий причинно-наслідковий зв'язок між пояснювальна та змінна відповіді.

На відміну від попередньої частини курсу з умовиводу для однієї змінної, де ми детально розглянули теорію, що стоїть за машиною тесту (наприклад, нульовий розподіл тестової статистики, під якою обчислюються p-значення), у процедурах виводу, які ми введемо в умовивід для Відносини, ми будемо обговорювати набагато менше такого роду деталей.

Принципи ті ж, але деталі, що стоять за нульовим розподілом тестової статистики (за якою обчислюється p-значення) ускладнюються і вимагають знання теоретичних результатів, які виходять за рамки цього курсу.

Замість цього в межах кожного з методів виводу ми зосередимося на:

  • Коли інференційний метод доречний до використання.
  • За яких умов процедуру можна сміливо використовувати.
  • Концептуальна ідея, що стоїть за тестом (як це зазвичай захоплюється статистикою тесту).
  • Як використовувати програмне забезпечення для проведення процедури, щоб отримати p-значення тесту.
  • Інтерпретація результатів в контексті проблеми.
  • Також ми продовжимо вводити кожен тест відповідно до чотириетапного процесу тестування гіпотез.

Двосторонні тести

З цього моменту ми, як правило, зосередимося на

  • ДВОСТОРОННІ тести і
  • Доповнюйте довірчими інтервалами для ефекту інтересу, щоб дати додаткову інформацію

Використання двосторонніх тестів є стандартною практикою в клінічних дослідженнях НАВІТЬ тоді, коли існує напрямок інтересу для гіпотези дослідження, наприклад, бажання довести нове лікування краще, ніж поточне лікування.

Ось кілька коментарів:

Тепер ми готові розпочати роботу з Case C→Q.