11.5: Тест на однорідність
Тест на доброту придатності може бути використаний для визначення того, чи відповідає популяція певному розподілу, але цього буде недостатньо, щоб вирішити, чи дотримуються дві популяції однакового невідомого розподілу. Інший тест, який називається тестом на однорідність, може бути використаний для того, щоб зробити висновок про те, чи мають дві популяції однаковий розподіл. Щоб розрахувати статистику тесту для тесту на однорідність, дотримуйтесь тієї ж процедури, що і при тесті на незалежність.
Очікуване значення для кожної клітинки має бути не менше п'яти, щоб ви могли використовувати цей тест.
Гіпотези
- H0: Розподіл двох популяцій однаковий.
- Ha: Розподіл двох популяцій не однаковий.
Тестова статистика
- Використовуйте статистикуχ2 тесту. Він обчислюється так само, як і тест на незалежність.
Ступені свободи (df)
- df=number of columns−1
Вимоги
- Всі значення в таблиці повинні бути більше або дорівнювати п'яти.
Загальне використання
Порівняння двох популяцій. Наприклад: чоловіки проти жінок, до проти після, схід проти заходу. Змінна є категоріальною з більш ніж двома можливими значеннями відповіді.
Приклад11.5.1
Чи мають чоловіки та жінки студенти коледжу однаковий розподіл умов життя? Використовуйте рівень значущості 0,05. Припустимо, що 250 випадково відібраних студентів-чоловіків та 300 випадково відібраних студенток коледжу запитали про їхні умови проживання: гуртожиток, квартира, з батьками, інше. Результати наведені в табл11.5.1. Чи мають чоловіки та жінки студенти коледжу однаковий розподіл умов життя?
Гуртожиток | Квартира | З батьками | Інше | |
Самці | 72 | 84 | 49 | 45 |
Самки | 91 | 86 | 88 | 35 |
Відповідь
- H0: Розподіл житлових умов для студентів коледжів є таким же, як розподіл житлових умов для студенток коледжів.
- Ha: Розподіл умов проживання для студентів коледжів чоловічої статі не є таким же, як розподіл умов проживання для студенток коледжу.
Ступені свободи (df):
df=number of columns−1=4−1=3
Розподіл для тесту:χ23
Розрахувати статистику тесту:χ2=10.1287 (калькулятор або комп'ютер)
Заява про ймовірність:p-value=P(χ2>10.1287)=0.0175
Натисніть кнопку
MATRX
клавіша і стрілка на
EDIT
. Преса
1:[A]
. Преса
2 ENTER 4 ENTER
. Введіть значення таблиці по рядках. Преса
ENTER
після кожного. Преса
2nd QUIT
. Преса
STAT
і стрілка на
TESTS
. Стрілка вниз до
C:χ2-TEST
. Преса
ENTER
. Ви повинні побачити
Observed:[A] and Expected:[B]
. Стрілка вниз до
Calculate
. Преса
ENTER
. Тестова статистика 10.1287 іp-value=0.0175. Виконайте процедуру вдруге, але стрілка вниз до
Draw
замість
calculate
.
Порівняйте α і p -значення: Оскільки задано noα, припустимоα=0.05. p-value=0.0175. α>p-value.
Прийміть рішення: З тих пірα>p-value, відхилитиH0. Це означає, що дистрибутиви не однакові.
Висновок: На рівні 5% значущості, з даних, є достатні докази, щоб зробити висновок про те, що розподіл умов проживання для студентів коледжів чоловічої та жіночої статі не однаковий.
Зверніть увагу, що висновок полягає лише в тому, що дистрибутиви не однакові. Ми не можемо використовувати тест на однорідність, щоб зробити будь-які висновки про те, чим вони відрізняються.
Вправа11.5.1
Чи мають сім'ї та одинокі однаковий розподіл автомобілів? Використовуйте рівень значущості 0,05. Припустимо, що 100 випадково обраних сімей і 200 випадково відібраних синглів запитали, який тип автомобіля вони їздили: спорт, седан, хетчбек, вантажівка, фургон/позашляховик. Результати наведені в табл11.5.2. Чи мають сім'ї та одинокі однаковий розподіл автомобілів? Тест на рівні значущості 0,05.
Спорт | Седан | Хетчбек | Вантажівка | Фургон/позашляховик | |
---|---|---|---|---|---|
Сім'я | 5 | 15 | 35 | 17 | 28 |
Одномісний | 45 | 65 | 37 | 46 | 7 |
Відповідь
При майжеp-value нулі ми відкидаємо нульову гіпотезу. Дані показують, що розподіл автомобілів не однаковий для сімей та одиноких.
Приклад 11.5.2
Як до, так і після недавнього землетрусу проводилися опитування виборців, за яких з трьох кандидатів вони планували голосувати на майбутніх виборах до міської ради. Чи відбулися зміни після землетрусу? Використовуйте рівень значущості 0,05. У таблиці наведені результати обстеження. Чи відбулися зміни в розподілі переваг виборців після землетрусу?
Перес | Чунг | Стівенс | |
До | 167 | 128 | 135 |
Після | 214 | 197 | 225 |
Відповідь
H0: Розподіл переваг виборців був однаковим до і після землетрусу.
Ha: Розподіл переваг виборців був неоднаковим до і після землетрусу.
Ступені свободи (df):
df=number of columns−1=3−1=2
Розподіл для тесту:χ22
Розрахувати статистику тесту:χ2=3.2603 (калькулятор або комп'ютер)
Заява про ймовірність:p-value=P(χ2>3.2603)=0.1959
Натисніть клавішу MATRX
і стрілку над EDIT
. Натисніть 1: [A]
. Натисніть 2 ENTER 3 ENTER
. Введіть значення таблиці по рядках. Натискаємо ENTER
після кожного. Натисніть 2nd QUIT
. Натисніть STAT
і стрілка до ТЕСТІВ
. Стрілка вниз до C: 2-тест
. Натисніть клавішу ENTER
. Ви повинні побачити Спостерігається: [A] і Очікуваний: [B]
. Стрілка вниз, щоб обчислити
. Натисніть клавішу ENTER
. Тестова статистика становить 3,2603, а p -значення = 0,1959. Виконайте процедуру вдруге, але стрілка вниз, щоб малювати
замість обчислення
.
Порівняйтеα іp-value:α=0.05 іp-value=0.1959. α<p-value.
Прийміть рішення: Оскількиα<p-value, не відкидайтеH0.
Висновок: На рівні 5% значущості, з даних, недостатньо доказів, щоб зробити висновок про те, що розподіл переваг виборців був неоднаковим до і після землетрусу.
Вправа11.5.2
Школи Ліги Плюща отримують багато заявок, але тільки деякі можуть бути прийняті. У школах, перерахованих в таблиці, приймаються два види заяв: регулярне і дострокове рішення.
Прийнятий тип заявки | Коричневий | Колумбія | Корнелл | Дартмут | Пенн | Єльський |
---|---|---|---|---|---|---|
Регулярний | 2 115 | 1 792 | 5 306 | 1 734 | 2 685 | 1 245 |
Дострокове рішення | 577 | 627 | 1 228 | 444 | 1 195 | 761 |
Ми хочемо знати, чи кількість прийнятих регулярних заявок відповідає тому ж розподілу, що і кількість прийнятих ранніх заявок. Викладіть нульову та альтернативну гіпотези, ступені свободи та статистику тесту, намалюйте графік p -значення та зробіть висновок про перевірку однорідності.
Відповідь
H0: Розподіл регулярних прийнятих заявок такий же, як і розподіл ранніх прийнятих заявок.
Ha: Розподіл регулярних прийнятих заявок не є таким же, як розподіл ранніх прийнятих заявок.
df=5
χ2test statistic=430.06

Натисніть клавішу MATRX
і стрілку над EDIT
. Натисніть 1: [A]
. Натисніть 3 ENTER 3 ENTER
. Введіть значення таблиці по рядках. Натискаємо ENTER
після кожного. Натисніть 2nd QUIT
. Натисніть STAT
і стрілка до ТЕСТІВ
. Стрілка вниз до C: 2-тест
.
Натисніть клавішу ENTER
. Ви повинні побачити Спостерігається: [A] і Очікуваний: [B]
. Стрілка вниз, щоб обчислити
. Натисніть клавішу ENTER
. Тестова статистика 430.06 іp-value=9.80E−91. Виконайте процедуру вдруге, але стрілка вниз, щоб малювати
замість обчислення
.
Посилання
- Дані Страхового інституту безпеки дорожнього руху, 2013. Доступно в Інтернеті за адресою www.iihs.org/iihs/рейтинги (доступ до 24 травня 2013 р.).
- «Використання енергії (кг нафтового еквівалента на душу населення)». Світовий банк, 2013. Доступно в Інтернеті за адресою http://data.worldbank.org/indicator/...G.OE/countries (доступ до 24 травня 2013 р.).
- «Опитування участі батьків та сім'ї 2007 Національної програми обстеження освіти домогосподарств (NHES)», Міністерство освіти США, Національний центр статистики освіти. Доступно в Інтернеті за адресою http://nces.ed.gov/pubsearch/pubsinf...? pubid=2009030 (доступ до 24 травня 2013 р.).
- «Опитування участі батьків та сім'ї 2007 Національної програми обстеження освіти домогосподарств (NHES)», Міністерство освіти США, Національний центр статистики освіти. Доступно в Інтернеті за адресою http://nces.ed.gov/pubs2009/2009030_sup.pdf (доступ до 24 травня 2013 р.).
Рецензія
Щоб оцінити, чи є два набори даних похідні з одного розподілу, що не потрібно знати, можна застосувати тест на однорідність, який використовує розподіл хі-квадратів. Нульова гіпотеза для цього тесту стверджує, що популяції двох наборів даних походять з одного розподілу. Тест порівнює спостережувані значення з очікуваними значеннями, якщо дві популяції дотримувалися однакового розподілу. Тест правохвостий. Кожне спостереження або категорія клітин повинні мати очікуване значення не менше п'яти.
Огляд формули
∑i⋅j(O−E)2EСтатистика тесту однорідності, де:O= спостережувані значення
E=очікувані значення
i=кількість рядків у таблиці непередбачених даних
j=кількість стовпців у таблиці непередбачених даних
df=(i−1)(j−1)Ступені свободи
Вправа11.5.3
Вчитель математики хоче побачити, чи два її класи мають однаковий розподіл тестових балів. Який тест їй слід використовувати?
Відповідь
тест на однорідність
Вправа11.5.4
Які нульові та альтернативні гіпотези для фізичних вправ?
Вправа11.5.5
Дослідник ринку хоче побачити, чи два різних магазини мають однаковий розподіл продажів протягом року. Який тип тесту він повинен використовувати?
Відповідь
тест на однорідність
Вправа11.5.6
Метеоролог хоче знати, чи однаковий розподіл штормів у Східній та Західній Австралії. Який тип тесту вона повинна використовувати?
Вправа11.5.7
Яка умова повинна бути дотримана, щоб використовувати тест на однорідність?
Відповідь
Всі значення в таблиці повинні бути більше або дорівнювати п'яти.
Використовуйте наступну інформацію, щоб відповісти на наступні п'ять вправ: Чи мають приватні лікарі практики та лікарі лікарень однаковий розподіл робочого часу? Припустимо, що вибірка з 100 лікарів приватної практики і 150 лікарів лікарні відбираються навмання і запитують про кількість годин на тиждень, які вони працюють. Результати наведені в табл.
20—30 | 30—40 | 40-50 | 50—60 | |
---|---|---|---|---|
Приватна практика | 16 | 40 | 38 | 6 |
Лікарня | 8 | 44 | 59 | 39 |
Вправа11.5.8
Створіть нульову та альтернативну гіпотези.
Вправа11.5.9
df=_______
Відповідь
3
Вправа11.5.10
Що таке тестова статистика?
Вправа11.5.11
Що такеp-value?
Відповідь
0,00005
Вправа11.5.12
Що ви можете зробити висновок на рівні 5% значущості?