Skip to main content
LibreTexts - Ukrayinska

11.5: Тест на однорідність

  • Page ID
    98333
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Тест на доброту придатності може бути використаний для визначення того, чи відповідає популяція певному розподілу, але цього буде недостатньо, щоб вирішити, чи дотримуються дві популяції однакового невідомого розподілу. Інший тест, який називається тестом на однорідність, може бути використаний для того, щоб зробити висновок про те, чи мають дві популяції однаковий розподіл. Щоб розрахувати статистику тесту для тесту на однорідність, дотримуйтесь тієї ж процедури, що і при тесті на незалежність.

    Очікуване значення для кожної клітинки має бути не менше п'яти, щоб ви могли використовувати цей тест.

    Гіпотези

    • \(H_{0}\): Розподіл двох популяцій однаковий.
    • \(H_{a}\): Розподіл двох популяцій не однаковий.

    Тестова статистика

    • Використовуйте статистику\(\chi^{2}\) тесту. Він обчислюється так само, як і тест на незалежність.

    Ступені свободи (\(df\))

    • \(df = \text{number of columns} - 1\)

    Вимоги

    • Всі значення в таблиці повинні бути більше або дорівнювати п'яти.

    Загальне використання

    Порівняння двох популяцій. Наприклад: чоловіки проти жінок, до проти після, схід проти заходу. Змінна є категоріальною з більш ніж двома можливими значеннями відповіді.

    Приклад\(\PageIndex{1}\)

    Чи мають чоловіки та жінки студенти коледжу однаковий розподіл умов життя? Використовуйте рівень значущості 0,05. Припустимо, що 250 випадково відібраних студентів-чоловіків та 300 випадково відібраних студенток коледжу запитали про їхні умови проживання: гуртожиток, квартира, з батьками, інше. Результати наведені в табл\(\PageIndex{1}\). Чи мають чоловіки та жінки студенти коледжу однаковий розподіл умов життя?

    Таблиця\(\PageIndex{1}\): Розподіл живих домовленостей для чоловіків коледжів та жінок коледжу
      Гуртожиток Квартира З батьками Інше
    Самці 72 84 49 45
    Самки 91 86 88 35

    Відповідь

    • \(H_{0}\): Розподіл житлових умов для студентів коледжів є таким же, як розподіл житлових умов для студенток коледжів.
    • \(H_{a}\): Розподіл умов проживання для студентів коледжів чоловічої статі не є таким же, як розподіл умов проживання для студенток коледжу.

    Ступені свободи (\(df\)):

    \(df = \text{number of columns} - 1 = 4 - 1 = 3\)

    Розподіл для тесту:\(\chi^{2}_{3}\)

    Розрахувати статистику тесту:\(\chi^{2} = 10.1287\) (калькулятор або комп'ютер)

    Заява про ймовірність:\(p\text{-value} = P(\chi^{2} > 10.1287) = 0.0175\)

    Натисніть кнопку

    MATRX

    клавіша і стрілка на

    EDIT

    . Преса

    1:[A]

    . Преса

    2 ENTER 4 ENTER

    . Введіть значення таблиці по рядках. Преса

    ENTER

    після кожного. Преса

    2nd QUIT

    . Преса

    STAT

    і стрілка на

    TESTS

    . Стрілка вниз до

    C:χ2-TEST

    . Преса

    ENTER

    . Ви повинні побачити

    Observed:[A] and Expected:[B]

    . Стрілка вниз до

    Calculate

    . Преса

    ENTER

    . Тестова статистика 10.1287 і\(p\text{-value} = 0.0175\). Виконайте процедуру вдруге, але стрілка вниз до

    Draw

    замість

    calculate

    .

    Порівняйте α і p -значення: Оскільки задано no\(\alpha\), припустимо\(\alpha = 0.05\). \(p\text{-value} = 0.0175\). \(\alpha > p\text{-value}\).

    Прийміть рішення: З тих пір\(\alpha > p\text{-value}\), відхилити\(H_{0}\). Це означає, що дистрибутиви не однакові.

    Висновок: На рівні 5% значущості, з даних, є достатні докази, щоб зробити висновок про те, що розподіл умов проживання для студентів коледжів чоловічої та жіночої статі не однаковий.

    Зверніть увагу, що висновок полягає лише в тому, що дистрибутиви не однакові. Ми не можемо використовувати тест на однорідність, щоб зробити будь-які висновки про те, чим вони відрізняються.

    Вправа\(\PageIndex{1}\)

    Чи мають сім'ї та одинокі однаковий розподіл автомобілів? Використовуйте рівень значущості 0,05. Припустимо, що 100 випадково обраних сімей і 200 випадково відібраних синглів запитали, який тип автомобіля вони їздили: спорт, седан, хетчбек, вантажівка, фургон/позашляховик. Результати наведені в табл\(\PageIndex{2}\). Чи мають сім'ї та одинокі однаковий розподіл автомобілів? Тест на рівні значущості 0,05.

    Таблиця\(\PageIndex{1}\)
      Спорт Седан Хетчбек Вантажівка Фургон/позашляховик
    Сім'я 5 15 35 17 28
    Одномісний 45 65 37 46 7

    Відповідь

    При майже\(p\text{-value}\) нулі ми відкидаємо нульову гіпотезу. Дані показують, що розподіл автомобілів не однаковий для сімей та одиноких.

    Приклад 11.5.2

    Як до, так і після недавнього землетрусу проводилися опитування виборців, за яких з трьох кандидатів вони планували голосувати на майбутніх виборах до міської ради. Чи відбулися зміни після землетрусу? Використовуйте рівень значущості 0,05. У таблиці наведені результати обстеження. Чи відбулися зміни в розподілі переваг виборців після землетрусу?

      Перес Чунг Стівенс
    До 167 128 135
    Після 214 197 225

    Відповідь

    \(H_{0}\): Розподіл переваг виборців був однаковим до і після землетрусу.

    \(H_{a}\): Розподіл переваг виборців був неоднаковим до і після землетрусу.

    Ступені свободи (df):

    \(df = \text{number of columns} - 1 = 3 - 1 = 2\)

    Розподіл для тесту:\(\chi^{2}_{2}\)

    Розрахувати статистику тесту:\(\chi^{2} = 3.2603\) (калькулятор або комп'ютер)

    Заява про ймовірність:\(p\text{-value} = P(\chi^{2} > 3.2603) = 0.1959\)

    Натисніть клавішу MATRX і стрілку над EDIT. Натисніть 1: [A]. Натисніть 2 ENTER 3 ENTER. Введіть значення таблиці по рядках. Натискаємо ENTER після кожного. Натисніть 2nd QUIT. Натисніть STAT і стрілка до ТЕСТІВ. Стрілка вниз до C: 2-тест. Натисніть клавішу ENTER. Ви повинні побачити Спостерігається: [A] і Очікуваний: [B]. Стрілка вниз, щоб обчислити. Натисніть клавішу ENTER. Тестова статистика становить 3,2603, а p -значення = 0,1959. Виконайте процедуру вдруге, але стрілка вниз, щоб малювати замість обчислення.

    Порівняйте\(\alpha\) і\(p\text{-value}\):\(\alpha = 0.05\) і\(p\text{-value} = 0.1959\). \(\alpha < p\text{-value}\).

    Прийміть рішення: Оскільки\(\alpha < p\text{-value}\), не відкидайте\(H_{0}\).

    Висновок: На рівні 5% значущості, з даних, недостатньо доказів, щоб зробити висновок про те, що розподіл переваг виборців був неоднаковим до і після землетрусу.

    Вправа\(\PageIndex{2}\)

    Школи Ліги Плюща отримують багато заявок, але тільки деякі можуть бути прийняті. У школах, перерахованих в таблиці, приймаються два види заяв: регулярне і дострокове рішення.

    Прийнятий тип заявки Коричневий Колумбія Корнелл Дартмут Пенн Єльський
    Регулярний 2 115 1 792 5 306 1 734 2 685 1 245
    Дострокове рішення 577 627 1 228 444 1 195 761

    Ми хочемо знати, чи кількість прийнятих регулярних заявок відповідає тому ж розподілу, що і кількість прийнятих ранніх заявок. Викладіть нульову та альтернативну гіпотези, ступені свободи та статистику тесту, намалюйте графік p -значення та зробіть висновок про перевірку однорідності.

    Відповідь

    \(H_{0}\): Розподіл регулярних прийнятих заявок такий же, як і розподіл ранніх прийнятих заявок.

    \(H_{a}\): Розподіл регулярних прийнятих заявок не є таким же, як розподіл ранніх прийнятих заявок.

    \(df = 5\)

    \(\chi^{2} \text{test statistic} = 430.06\)

    Це несиметрична хи-квадратна крива з df = 5. Значення 0, 5 і 430.06 позначені на горизонтальній осі. Значення 5 збігається з піком кривої. Вертикальна лінія вгору простягається від 430.06 до кривої, а область праворуч від цієї лінії затінюється. Затінена площа дорівнює p-значенню.
    Малюнок\(\PageIndex{1}\).

    Натисніть клавішу MATRX і стрілку над EDIT. Натисніть 1: [A]. Натисніть 3 ENTER 3 ENTER. Введіть значення таблиці по рядках. Натискаємо ENTER після кожного. Натисніть 2nd QUIT. Натисніть STAT і стрілка до ТЕСТІВ. Стрілка вниз до C: 2-тест. Натисніть клавішу ENTER. Ви повинні побачити Спостерігається: [A] і Очікуваний: [B]. Стрілка вниз, щоб обчислити. Натисніть клавішу ENTER. Тестова статистика 430.06 і\(p\text{-value} = 9.80E-91\). Виконайте процедуру вдруге, але стрілка вниз, щоб малювати замість обчислення.

    Посилання

    1. Дані Страхового інституту безпеки дорожнього руху, 2013. Доступно в Інтернеті за адресою www.iihs.org/iihs/рейтинги (доступ до 24 травня 2013 р.).
    2. «Використання енергії (кг нафтового еквівалента на душу населення)». Світовий банк, 2013. Доступно в Інтернеті за адресою http://data.worldbank.org/indicator/...G.OE/countries (доступ до 24 травня 2013 р.).
    3. «Опитування участі батьків та сім'ї 2007 Національної програми обстеження освіти домогосподарств (NHES)», Міністерство освіти США, Національний центр статистики освіти. Доступно в Інтернеті за адресою http://nces.ed.gov/pubsearch/pubsinf...? pubid=2009030 (доступ до 24 травня 2013 р.).
    4. «Опитування участі батьків та сім'ї 2007 Національної програми обстеження освіти домогосподарств (NHES)», Міністерство освіти США, Національний центр статистики освіти. Доступно в Інтернеті за адресою http://nces.ed.gov/pubs2009/2009030_sup.pdf (доступ до 24 травня 2013 р.).

    Рецензія

    Щоб оцінити, чи є два набори даних похідні з одного розподілу, що не потрібно знати, можна застосувати тест на однорідність, який використовує розподіл хі-квадратів. Нульова гіпотеза для цього тесту стверджує, що популяції двох наборів даних походять з одного розподілу. Тест порівнює спостережувані значення з очікуваними значеннями, якщо дві популяції дотримувалися однакового розподілу. Тест правохвостий. Кожне спостереження або категорія клітин повинні мати очікуване значення не менше п'яти.

    Огляд формули

    \(\sum_{i \cdot j} \frac{(O-E)^{2}}{E}\)Статистика тесту однорідності, де:\(O =\) спостережувані значення

    \(E =\)очікувані значення

    \(i =\)кількість рядків у таблиці непередбачених даних

    \(j =\)кількість стовпців у таблиці непередбачених даних

    \(df = (i −1)(j −1)\)Ступені свободи

    Вправа\(\PageIndex{3}\)

    Вчитель математики хоче побачити, чи два її класи мають однаковий розподіл тестових балів. Який тест їй слід використовувати?

    Відповідь

    тест на однорідність

    Вправа\(\PageIndex{4}\)

    Які нульові та альтернативні гіпотези для фізичних вправ?

    Вправа\(\PageIndex{5}\)

    Дослідник ринку хоче побачити, чи два різних магазини мають однаковий розподіл продажів протягом року. Який тип тесту він повинен використовувати?

    Відповідь

    тест на однорідність

    Вправа\(\PageIndex{6}\)

    Метеоролог хоче знати, чи однаковий розподіл штормів у Східній та Західній Австралії. Який тип тесту вона повинна використовувати?

    Вправа\(\PageIndex{7}\)

    Яка умова повинна бути дотримана, щоб використовувати тест на однорідність?

    Відповідь

    Всі значення в таблиці повинні бути більше або дорівнювати п'яти.

    Використовуйте наступну інформацію, щоб відповісти на наступні п'ять вправ: Чи мають приватні лікарі практики та лікарі лікарень однаковий розподіл робочого часу? Припустимо, що вибірка з 100 лікарів приватної практики і 150 лікарів лікарні відбираються навмання і запитують про кількість годин на тиждень, які вони працюють. Результати наведені в табл.

      20—30 30—40 40-50 50—60
    Приватна практика 16 40 38 6
    Лікарня 8 44 59 39

    Вправа\(\PageIndex{8}\)

    Створіть нульову та альтернативну гіпотези.

    Вправа\(\PageIndex{9}\)

    \(df =\)_______

    Відповідь

    3

    Вправа\(\PageIndex{10}\)

    Що таке тестова статистика?

    Вправа\(\PageIndex{11}\)

    Що таке\(p\text{-value}\)?

    Відповідь

    0,00005

    Вправа\(\PageIndex{12}\)

    Що ви можете зробити висновок на рівні 5% значущості?