Skip to main content
LibreTexts - Ukrayinska

10.10: Різниця між засобами

  • Page ID
    98047
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Цілі навчання

    • Викладіть припущення для обчислення довірчого інтервалу на різниці між засобами
    • Обчислити довірчий інтервал на різниці між засобами
    • Форматування даних для комп'ютерного аналізу

    Набагато частіше дослідник цікавиться різницею між засобами, ніж конкретними значеннями самих засобів. Ми візьмемо як приклад дані з тематичного дослідження «Animal Research». У цьому експерименті студенти оцінили (за\(7\) -бальною шкалою), чи вважали вони дослідження тварин неправильним. Розміри вибірки, засоби і відхилення наведені окремо для самців і самок в табл\(\PageIndex{1}\).

    Таблиця\(\PageIndex{1}\): Засоби та відхилення у дослідженні тварин
    Стан п Середнє дисперсія
    Самки 17 5.353 2.743
    Самці 17 3.882 2.985

    Як бачите, самки оцінили дослідження тварин як більш неправильні, ніж самці. Ця вибіркова різниця між жіночим\(5.35\) середнім і чоловічим середнім\(3.88\) є\(1.47\). Однак гендерна різниця в цій конкретній вибірці не дуже важлива. Що важливо, так це різниця в популяції. Різниця в вибіркових засобах використовується для оцінки різниці в засобах популяції. Точність оцінки виявляється довірчим інтервалом.

    Для того, щоб побудувати довірчий інтервал, ми зробимо три припущення:

    1. Дві популяції мають однакову дисперсію. Це припущення називається припущенням однорідності дисперсії.
    2. Популяції зазвичай розподілені.
    3. Кожне значення відбирається незалежно один від одного значення.

    Наслідки порушення цих припущень розглядаються в наступному розділі. Поки що досить сказати, що від дрібних до помірних порушень припущень\(1\) і\(2\) особливої різниці не мають.

    Довірчий інтервал по різниці між засобами обчислюється за такою формулою:

    \[\text{Lower Limit} = M_1 - M_2 -(t_{CL})(S_{M_1-M_2})\]

    \[\text{Upper Limit} = M_1 - M_2 +(t_{CL})(S_{M_1-M_2})\]

    де\(M_1 - M_2\) - різниця між вибірковими засобами,\(t_{CL}\) є t для потрібного рівня довіри, і\(S_{M_1-M_2}\) є розрахунковою стандартною похибкою різниці між вибірковими засобами. Значення цих термінів будуть зрозумілішими в міру демонстрації розрахунків.

    Ми продовжуємо використовувати дані тематичного дослідження «Animal Research» і обчислимо довірчий інтервал на різницю між середнім балом самок і середнім балом самців. Для цього розрахунку ми будемо вважати, що дисперсії в кожній з двох популяцій рівні.

    Насамперед необхідно обчислити оцінку стандартної похибки різниці між засобами (\(S_{M_1-M_2}\)). Нагадаємо з відповідного розділу в главі про розподілах вибірки, що формула стандартної похибки різниці засобів в популяції така:

    \[\sigma _{M_1-M_2}=\sqrt{\frac{\sigma _{1}^{2}}{n_1}+\frac{\sigma _{2}^{2}}{n_2}}=\sqrt{\frac{\sigma ^{2}}{n}+\frac{\sigma ^{2}}{n}}=\sqrt{\frac{2\sigma ^2}{n}}\]

    Для того, щоб оцінити цю кількість, ми оцінюємо\(\sigma ^2\) і використовуємо цю оцінку замість\(\sigma ^2\). Оскільки ми припускаємо, що дисперсії в сукупності однакові, ми оцінюємо цю дисперсію шляхом усереднення наших двох відхилень вибірки. Таким чином, наша оцінка дисперсії обчислюється за такою формулою:

    \[MSE=\frac{s_{1}^{2}+s_{2}^{2}}{2}\]

    де\(MSE\) наша оцінка\(\sigma ^2\). У цьому прикладі

    \[MSE=\frac{2.743 + 2.985}{2}=2.864\]

    Зверніть увагу, що\(MSE\) означає «середня квадратна помилка» і є середнім квадратом відхилення кожного балу від середнього значення своєї групи.

    Оскільки\(n\) (кількість балів в кожній умові) є\(17\),

    \[S_{M_1-M_2}=\sqrt{\frac{2MSE}{n}}=\sqrt{\frac{(2)(2.864)}{17}}=0.5805\]

    Наступним кроком є пошук використання\(t\) для довірчого інтервалу (\(t_{CL}\)). Для розрахунку\(t_{CL}\) нам потрібно знати ступені свободи. Ступінь свободи - це кількість незалежних оцінок дисперсії, на яких\(MSE\) грунтується. Це\(n_1\) дорівнює\((n_1 - 1) + (n_2 - 1)\) де - розмір вибірки першої групи і розмір\(n_2\) вибірки другої групи. Для цього прикладу,\(n_1= n_2 = 17\). Коли\(n_1= n_2\), прийнято використовувати "\(n\)" для позначення розміру вибірки кожної групи. Тому ступені свободи є\(16 + 16 = 32\).

    Калькулятор: Знайти t для довірчого інтервалу

    З наведеного вище калькулятора або\(t\) таблиці ви можете виявити, що\(t\) для\(95\%\) довірчого інтервалу для\(32 df\) є\(2.037\).

    Тепер у нас є всі компоненти, необхідні для обчислення довірчого інтервалу. По-перше, ми знаємо різницю між засобами:

    \[M_1 - M_2 = 5.353 - 3.882 = 1.471\]

    Ми знаємо стандартну похибку різниці між засобами є

    \[S_{M_1 - M2} = 0.5805\]

    і що\(t\) для\(95\%\) довіри інтервал з\(32 df\) є

    \[t_{CL}=2.037\]

    Тому\(95\%\) довірчий інтервал дорівнює

    \[\text{Lower Limit} = 1.471 - (2.037)(0.5805) = 0.29\]

    \[\text{Upper Limit} = 1.471 + (2.037)(0.5805) = 2.65\]

    Ми можемо записати довірчий інтервал як:

    \[0.29 \leq \mu _f - \mu _m \leq 2.65\]

    де\(\mu _f\) - середнє значення популяції для самок і\(\mu _m\) середнє значення популяції для самців. Цей аналіз дає докази того, що середнє значення для жінок вище середнього значення для чоловіків, і що різниця між засобами в популяції, ймовірно, буде між\(0.29\) і\(2.65\).

    Форматування даних для комп'ютерного аналізу

    Більшість комп'ютерних програм, які обчислюють\(t\) тести, вимагають, щоб ваші дані були в певній формі. Розглянемо дані в табл\(\PageIndex{2}\).

    Таблиця\(\PageIndex{2}\): Приклад даних
    Група 1 Група 2
    3 5
    4 6
    5 7

    Тут є дві групи, кожна з яких має три спостереження. Щоб відформатувати ці дані для комп'ютерної програми, зазвичай потрібно використовувати дві змінні: перша вказує групу, в якій знаходиться суб'єкт, а друга - сама оцінка. Для даних у таблиці\(\PageIndex{2}\) переформатовані дані виглядають наступним чином:

    Таблиця\(\PageIndex{3}\): Переформатовані дані
    Г У
    1 3
    1 4
    1 5
    2 5
    2 6
    2 7

    Щоб використовувати Analysis Lab для виконання розрахунків, ви повинні скопіювати дані, а потім

    Натисніть кнопку «Введення/редагування даних користувача». (Можливо, вас попереджають, що з міркувань безпеки ви повинні використовувати комбінацію клавіш для вставки даних.)

    1. Вставте свої дані.
    2. Натисніть «Прийняти дані».
    3. Встановіть залежну змінну на\(Y\).
    4. Встановіть для змінної групування значення\(G\).
    5. Натисніть кнопку\(t\) -test довіри інтервал.

    \(95\%\)Довірчий інтервал на різниці між засобами поширюється від\(-4.267\) до\(0.267\).

    Обчислення для нерівних розмірів вибірки (необов'язково)

    Розрахунки дещо складніше, коли розміри вибірки не рівні. Одне з міркувань полягає в тому\(MSE\), що оцінка дисперсії підраховує зразок з більшим розміром вибірки більше, ніж зразок з меншим розміром вибірки. Обчислювально це робиться шляхом обчислення суми квадратів error (\(SSE\)) наступним чином:

    \[SSE=\sum (X-M_1)^2+\sum (X-M_2)^2\]

    де\(M_1\) - середнє для групи\(1\) і\(M_2\) середнє значення для групи\(2\). Розглянемо наступний невеликий приклад:

    Таблиця\(\PageIndex{4}\): Приклад даних
    Група 1 Група 2
    3 2
    4 4
    5

    \[M_1 = 4\; \; and\; \; M_2 = 3\]

    \[SSE = (3-4)^2 + (4-4)^2 + (5-4)^2 + (2-3)^2 + (4-3)^2 = 4\]

    Потім\(MSE\) обчислюється:\[MSE=\frac{SSE}{df}\]

    де ступені свободи (\(df\)) обчислюються, як і раніше:

    \[df = (n_1 -1) + (n_2 -1) = (3-1) + (2-1) = 3\]

    \[MSE=\frac{SSE}{df}=\frac{4}{3}=1.333\]

    Формула

    \[S_{M_1-M_2}=\sqrt{\frac{2MSE}{n}}\]

    замінюється на

    \[S_{M_1-M_2}=\sqrt{\frac{2MSE}{n_h}}\]

    де\(n_h\) - гармонійне середнє розмірів вибірки і обчислюється наступним чином:

    \[n_h=\frac{2}{\tfrac{1}{n_1}+\tfrac{1}{n_2}}=\frac{2}{\tfrac{1}{3}+\tfrac{1}{2}}=2.4\]

    і

    \[S_{M_1-M_2}=\sqrt{\frac{(2)(1.333)}{2.4}}=1.054\]

    \(t_{CL}\)для\(3 df\) і\(0.05\) рівень дорівнює\(3.182\).

    Тому\(95\%\) довірчий інтервал дорівнює

    \[\text{Lower Limit} = 1 - (3.182)(1.054)= -2.35\]

    \[\text{Upper Limit} = 1 + (3.182)(1.054)= 4.35\]

    Ми можемо записати довірчий інтервал як:

    \[-2.35 \leq \mu _1 - \mu _2 \leq 4.35\]