10.10: Різниця між засобами
Цілі навчання
- Викладіть припущення для обчислення довірчого інтервалу на різниці між засобами
- Обчислити довірчий інтервал на різниці між засобами
- Форматування даних для комп'ютерного аналізу
Набагато частіше дослідник цікавиться різницею між засобами, ніж конкретними значеннями самих засобів. Ми візьмемо як приклад дані з тематичного дослідження «Animal Research». У цьому експерименті студенти оцінили (за7 -бальною шкалою), чи вважали вони дослідження тварин неправильним. Розміри вибірки, засоби і відхилення наведені окремо для самців і самок в табл10.10.1.
Стан | п | Середнє | дисперсія |
---|---|---|---|
Самки | 17 | 5.353 | 2.743 |
Самці | 17 | 3.882 | 2.985 |
Як бачите, самки оцінили дослідження тварин як більш неправильні, ніж самці. Ця вибіркова різниця між жіночим5.35 середнім і чоловічим середнім3.88 є1.47. Однак гендерна різниця в цій конкретній вибірці не дуже важлива. Що важливо, так це різниця в популяції. Різниця в вибіркових засобах використовується для оцінки різниці в засобах популяції. Точність оцінки виявляється довірчим інтервалом.
Для того, щоб побудувати довірчий інтервал, ми зробимо три припущення:
- Дві популяції мають однакову дисперсію. Це припущення називається припущенням однорідності дисперсії.
- Популяції зазвичай розподілені.
- Кожне значення відбирається незалежно один від одного значення.
Наслідки порушення цих припущень розглядаються в наступному розділі. Поки що досить сказати, що від дрібних до помірних порушень припущень1 і2 особливої різниці не мають.
Довірчий інтервал по різниці між засобами обчислюється за такою формулою:
Lower Limit=M1−M2−(tCL)(SM1−M2)
Upper Limit=M1−M2+(tCL)(SM1−M2)
деM1−M2 - різниця між вибірковими засобами,tCL є t для потрібного рівня довіри, іSM1−M2 є розрахунковою стандартною похибкою різниці між вибірковими засобами. Значення цих термінів будуть зрозумілішими в міру демонстрації розрахунків.
Ми продовжуємо використовувати дані тематичного дослідження «Animal Research» і обчислимо довірчий інтервал на різницю між середнім балом самок і середнім балом самців. Для цього розрахунку ми будемо вважати, що дисперсії в кожній з двох популяцій рівні.
Насамперед необхідно обчислити оцінку стандартної похибки різниці між засобами (SM1−M2). Нагадаємо з відповідного розділу в главі про розподілах вибірки, що формула стандартної похибки різниці засобів в популяції така:
σM1−M2=√σ21n1+σ22n2=√σ2n+σ2n=√2σ2n
Для того, щоб оцінити цю кількість, ми оцінюємоσ2 і використовуємо цю оцінку замістьσ2. Оскільки ми припускаємо, що дисперсії в сукупності однакові, ми оцінюємо цю дисперсію шляхом усереднення наших двох відхилень вибірки. Таким чином, наша оцінка дисперсії обчислюється за такою формулою:
MSE=s21+s222
деMSE наша оцінкаσ2. У цьому прикладі
MSE=2.743+2.9852=2.864
Зверніть увагу, щоMSE означає «середня квадратна помилка» і є середнім квадратом відхилення кожного балу від середнього значення своєї групи.
Оскількиn (кількість балів в кожній умові) є17,
SM1−M2=√2MSEn=√(2)(2.864)17=0.5805
Наступним кроком є пошук використанняt для довірчого інтервалу (tCL). Для розрахункуtCL нам потрібно знати ступені свободи. Ступінь свободи - це кількість незалежних оцінок дисперсії, на якихMSE грунтується. Цеn1 дорівнює(n1−1)+(n2−1) де - розмір вибірки першої групи і розмірn2 вибірки другої групи. Для цього прикладу,n1=n2=17. Колиn1=n2, прийнято використовувати "n" для позначення розміру вибірки кожної групи. Тому ступені свободи є16+16=32.
Калькулятор: Знайти t для довірчого інтервалу
З наведеного вище калькулятора абоt таблиці ви можете виявити, щоt для95% довірчого інтервалу для32df є2.037.
Тепер у нас є всі компоненти, необхідні для обчислення довірчого інтервалу. По-перше, ми знаємо різницю між засобами:
M1−M2=5.353−3.882=1.471
Ми знаємо стандартну похибку різниці між засобами є
SM1−M2=0.5805
і щоt для95% довіри інтервал з32df є
tCL=2.037
Тому95% довірчий інтервал дорівнює
Lower Limit=1.471−(2.037)(0.5805)=0.29
Upper Limit=1.471+(2.037)(0.5805)=2.65
Ми можемо записати довірчий інтервал як:
0.29≤μf−μm≤2.65
деμf - середнє значення популяції для самок іμm середнє значення популяції для самців. Цей аналіз дає докази того, що середнє значення для жінок вище середнього значення для чоловіків, і що різниця між засобами в популяції, ймовірно, буде між0.29 і2.65.
Форматування даних для комп'ютерного аналізу
Більшість комп'ютерних програм, які обчислюютьt тести, вимагають, щоб ваші дані були в певній формі. Розглянемо дані в табл10.10.2.
Група 1 | Група 2 |
---|---|
3 | 5 |
4 | 6 |
5 | 7 |
Тут є дві групи, кожна з яких має три спостереження. Щоб відформатувати ці дані для комп'ютерної програми, зазвичай потрібно використовувати дві змінні: перша вказує групу, в якій знаходиться суб'єкт, а друга - сама оцінка. Для даних у таблиці10.10.2 переформатовані дані виглядають наступним чином:
Г | У |
---|---|
1 | 3 |
1 | 4 |
1 | 5 |
2 | 5 |
2 | 6 |
2 | 7 |
Щоб використовувати Analysis Lab для виконання розрахунків, ви повинні скопіювати дані, а потім
Натисніть кнопку «Введення/редагування даних користувача». (Можливо, вас попереджають, що з міркувань безпеки ви повинні використовувати комбінацію клавіш для вставки даних.)
- Вставте свої дані.
- Натисніть «Прийняти дані».
- Встановіть залежну змінну наY.
- Встановіть для змінної групування значенняG.
- Натисніть кнопкуt -test довіри інтервал.
95%Довірчий інтервал на різниці між засобами поширюється від−4.267 до0.267.
Обчислення для нерівних розмірів вибірки (необов'язково)
Розрахунки дещо складніше, коли розміри вибірки не рівні. Одне з міркувань полягає в томуMSE, що оцінка дисперсії підраховує зразок з більшим розміром вибірки більше, ніж зразок з меншим розміром вибірки. Обчислювально це робиться шляхом обчислення суми квадратів error (SSE) наступним чином:
SSE=∑(X−M1)2+∑(X−M2)2
деM1 - середнє для групи1 іM2 середнє значення для групи2. Розглянемо наступний невеликий приклад:
Група 1 | Група 2 |
---|---|
3 | 2 |
4 | 4 |
5 |
M1=4andM2=3
SSE=(3−4)2+(4−4)2+(5−4)2+(2−3)2+(4−3)2=4
ПотімMSE обчислюється:MSE=SSEdf
де ступені свободи (df) обчислюються, як і раніше:
df=(n1−1)+(n2−1)=(3−1)+(2−1)=3
MSE=SSEdf=43=1.333
Формула
SM1−M2=√2MSEn
замінюється на
SM1−M2=√2MSEnh
деnh - гармонійне середнє розмірів вибірки і обчислюється наступним чином:
nh=21n1+1n2=213+12=2.4
і
SM1−M2=√(2)(1.333)2.4=1.054
tCLдля3df і0.05 рівень дорівнює3.182.
Тому95% довірчий інтервал дорівнює
Lower Limit=1−(3.182)(1.054)=−2.35
Upper Limit=1+(3.182)(1.054)=4.35
Ми можемо записати довірчий інтервал як:
−2.35≤μ1−μ2≤4.35