10.10: Різниця між засобами
- Page ID
- 98047
Цілі навчання
- Викладіть припущення для обчислення довірчого інтервалу на різниці між засобами
- Обчислити довірчий інтервал на різниці між засобами
- Форматування даних для комп'ютерного аналізу
Набагато частіше дослідник цікавиться різницею між засобами, ніж конкретними значеннями самих засобів. Ми візьмемо як приклад дані з тематичного дослідження «Animal Research». У цьому експерименті студенти оцінили (за\(7\) -бальною шкалою), чи вважали вони дослідження тварин неправильним. Розміри вибірки, засоби і відхилення наведені окремо для самців і самок в табл\(\PageIndex{1}\).
| Стан | п | Середнє | дисперсія |
|---|---|---|---|
| Самки | 17 | 5.353 | 2.743 |
| Самці | 17 | 3.882 | 2.985 |
Як бачите, самки оцінили дослідження тварин як більш неправильні, ніж самці. Ця вибіркова різниця між жіночим\(5.35\) середнім і чоловічим середнім\(3.88\) є\(1.47\). Однак гендерна різниця в цій конкретній вибірці не дуже важлива. Що важливо, так це різниця в популяції. Різниця в вибіркових засобах використовується для оцінки різниці в засобах популяції. Точність оцінки виявляється довірчим інтервалом.
Для того, щоб побудувати довірчий інтервал, ми зробимо три припущення:
- Дві популяції мають однакову дисперсію. Це припущення називається припущенням однорідності дисперсії.
- Популяції зазвичай розподілені.
- Кожне значення відбирається незалежно один від одного значення.
Наслідки порушення цих припущень розглядаються в наступному розділі. Поки що досить сказати, що від дрібних до помірних порушень припущень\(1\) і\(2\) особливої різниці не мають.
Довірчий інтервал по різниці між засобами обчислюється за такою формулою:
\[\text{Lower Limit} = M_1 - M_2 -(t_{CL})(S_{M_1-M_2})\]
\[\text{Upper Limit} = M_1 - M_2 +(t_{CL})(S_{M_1-M_2})\]
де\(M_1 - M_2\) - різниця між вибірковими засобами,\(t_{CL}\) є t для потрібного рівня довіри, і\(S_{M_1-M_2}\) є розрахунковою стандартною похибкою різниці між вибірковими засобами. Значення цих термінів будуть зрозумілішими в міру демонстрації розрахунків.
Ми продовжуємо використовувати дані тематичного дослідження «Animal Research» і обчислимо довірчий інтервал на різницю між середнім балом самок і середнім балом самців. Для цього розрахунку ми будемо вважати, що дисперсії в кожній з двох популяцій рівні.
Насамперед необхідно обчислити оцінку стандартної похибки різниці між засобами (\(S_{M_1-M_2}\)). Нагадаємо з відповідного розділу в главі про розподілах вибірки, що формула стандартної похибки різниці засобів в популяції така:
\[\sigma _{M_1-M_2}=\sqrt{\frac{\sigma _{1}^{2}}{n_1}+\frac{\sigma _{2}^{2}}{n_2}}=\sqrt{\frac{\sigma ^{2}}{n}+\frac{\sigma ^{2}}{n}}=\sqrt{\frac{2\sigma ^2}{n}}\]
Для того, щоб оцінити цю кількість, ми оцінюємо\(\sigma ^2\) і використовуємо цю оцінку замість\(\sigma ^2\). Оскільки ми припускаємо, що дисперсії в сукупності однакові, ми оцінюємо цю дисперсію шляхом усереднення наших двох відхилень вибірки. Таким чином, наша оцінка дисперсії обчислюється за такою формулою:
\[MSE=\frac{s_{1}^{2}+s_{2}^{2}}{2}\]
де\(MSE\) наша оцінка\(\sigma ^2\). У цьому прикладі
\[MSE=\frac{2.743 + 2.985}{2}=2.864\]
Зверніть увагу, що\(MSE\) означає «середня квадратна помилка» і є середнім квадратом відхилення кожного балу від середнього значення своєї групи.
Оскільки\(n\) (кількість балів в кожній умові) є\(17\),
\[S_{M_1-M_2}=\sqrt{\frac{2MSE}{n}}=\sqrt{\frac{(2)(2.864)}{17}}=0.5805\]
Наступним кроком є пошук використання\(t\) для довірчого інтервалу (\(t_{CL}\)). Для розрахунку\(t_{CL}\) нам потрібно знати ступені свободи. Ступінь свободи - це кількість незалежних оцінок дисперсії, на яких\(MSE\) грунтується. Це\(n_1\) дорівнює\((n_1 - 1) + (n_2 - 1)\) де - розмір вибірки першої групи і розмір\(n_2\) вибірки другої групи. Для цього прикладу,\(n_1= n_2 = 17\). Коли\(n_1= n_2\), прийнято використовувати "\(n\)" для позначення розміру вибірки кожної групи. Тому ступені свободи є\(16 + 16 = 32\).
Калькулятор: Знайти t для довірчого інтервалу
З наведеного вище калькулятора або\(t\) таблиці ви можете виявити, що\(t\) для\(95\%\) довірчого інтервалу для\(32 df\) є\(2.037\).
Тепер у нас є всі компоненти, необхідні для обчислення довірчого інтервалу. По-перше, ми знаємо різницю між засобами:
\[M_1 - M_2 = 5.353 - 3.882 = 1.471\]
Ми знаємо стандартну похибку різниці між засобами є
\[S_{M_1 - M2} = 0.5805\]
і що\(t\) для\(95\%\) довіри інтервал з\(32 df\) є
\[t_{CL}=2.037\]
Тому\(95\%\) довірчий інтервал дорівнює
\[\text{Lower Limit} = 1.471 - (2.037)(0.5805) = 0.29\]
\[\text{Upper Limit} = 1.471 + (2.037)(0.5805) = 2.65\]
Ми можемо записати довірчий інтервал як:
\[0.29 \leq \mu _f - \mu _m \leq 2.65\]
де\(\mu _f\) - середнє значення популяції для самок і\(\mu _m\) середнє значення популяції для самців. Цей аналіз дає докази того, що середнє значення для жінок вище середнього значення для чоловіків, і що різниця між засобами в популяції, ймовірно, буде між\(0.29\) і\(2.65\).
Форматування даних для комп'ютерного аналізу
Більшість комп'ютерних програм, які обчислюють\(t\) тести, вимагають, щоб ваші дані були в певній формі. Розглянемо дані в табл\(\PageIndex{2}\).
| Група 1 | Група 2 |
|---|---|
| 3 | 5 |
| 4 | 6 |
| 5 | 7 |
Тут є дві групи, кожна з яких має три спостереження. Щоб відформатувати ці дані для комп'ютерної програми, зазвичай потрібно використовувати дві змінні: перша вказує групу, в якій знаходиться суб'єкт, а друга - сама оцінка. Для даних у таблиці\(\PageIndex{2}\) переформатовані дані виглядають наступним чином:
| Г | У |
|---|---|
| 1 | 3 |
| 1 | 4 |
| 1 | 5 |
| 2 | 5 |
| 2 | 6 |
| 2 | 7 |
Щоб використовувати Analysis Lab для виконання розрахунків, ви повинні скопіювати дані, а потім
Натисніть кнопку «Введення/редагування даних користувача». (Можливо, вас попереджають, що з міркувань безпеки ви повинні використовувати комбінацію клавіш для вставки даних.)
- Вставте свої дані.
- Натисніть «Прийняти дані».
- Встановіть залежну змінну на\(Y\).
- Встановіть для змінної групування значення\(G\).
- Натисніть кнопку\(t\) -test довіри інтервал.
\(95\%\)Довірчий інтервал на різниці між засобами поширюється від\(-4.267\) до\(0.267\).
Обчислення для нерівних розмірів вибірки (необов'язково)
Розрахунки дещо складніше, коли розміри вибірки не рівні. Одне з міркувань полягає в тому\(MSE\), що оцінка дисперсії підраховує зразок з більшим розміром вибірки більше, ніж зразок з меншим розміром вибірки. Обчислювально це робиться шляхом обчислення суми квадратів error (\(SSE\)) наступним чином:
\[SSE=\sum (X-M_1)^2+\sum (X-M_2)^2\]
де\(M_1\) - середнє для групи\(1\) і\(M_2\) середнє значення для групи\(2\). Розглянемо наступний невеликий приклад:
| Група 1 | Група 2 |
|---|---|
| 3 | 2 |
| 4 | 4 |
| 5 |
\[M_1 = 4\; \; and\; \; M_2 = 3\]
\[SSE = (3-4)^2 + (4-4)^2 + (5-4)^2 + (2-3)^2 + (4-3)^2 = 4\]
Потім\(MSE\) обчислюється:\[MSE=\frac{SSE}{df}\]
де ступені свободи (\(df\)) обчислюються, як і раніше:
\[df = (n_1 -1) + (n_2 -1) = (3-1) + (2-1) = 3\]
\[MSE=\frac{SSE}{df}=\frac{4}{3}=1.333\]
Формула
\[S_{M_1-M_2}=\sqrt{\frac{2MSE}{n}}\]
замінюється на
\[S_{M_1-M_2}=\sqrt{\frac{2MSE}{n_h}}\]
де\(n_h\) - гармонійне середнє розмірів вибірки і обчислюється наступним чином:
\[n_h=\frac{2}{\tfrac{1}{n_1}+\tfrac{1}{n_2}}=\frac{2}{\tfrac{1}{3}+\tfrac{1}{2}}=2.4\]
і
\[S_{M_1-M_2}=\sqrt{\frac{(2)(1.333)}{2.4}}=1.054\]
\(t_{CL}\)для\(3 df\) і\(0.05\) рівень дорівнює\(3.182\).
Тому\(95\%\) довірчий інтервал дорівнює
\[\text{Lower Limit} = 1 - (3.182)(1.054)= -2.35\]
\[\text{Upper Limit} = 1 + (3.182)(1.054)= 4.35\]
Ми можемо записати довірчий інтервал як:
\[-2.35 \leq \mu _1 - \mu _2 \leq 4.35\]
