15.3: Однофакторна ANOVA
Цілі навчання
- Створіть, що оцінює середній квадрат між (MSB), коли нульова гіпотеза істинна і коли нульова гіпотеза помилкова
- ОбчислитиMSE
- ОбчисленняF та два його параметри ступеня свободи
- Поясніть, чому ANOVA найкраще розглядається як тест з двома хвостами, хоча буквально використовується лише один хвіст дистрибутива
- Розділення сум квадратів на умову та помилку
- Форматування даних для використання з програмою комп'ютерної статистики
У цьому розділі показано, як ANOVA можна використовувати для аналізу однофакторного дизайну між предметами. В якості основного прикладу ми будемо використовувати тематичне дослідження «Усмішки та поблажливість». У цьому дослідженні було чотири умови з34 суб'єктами в кожному стані. Був один бал на предмет. Нульова гіпотеза, перевірена ANOVA, полягає в тому, що засоби популяції для всіх умов однакові. Це може виражатися наступним чином:
H0:μ1=μ2=...=μk
деH0 нульова гіпотеза іk - кількість умов. У дослідженні «Усмішки та поблажливість» нульова гіпотезаk=4
H0:μfalse=μfelt=μmiserable=μneutral
Якщо нульова гіпотеза відхилена, то можна зробити висновок, що хоча б одне з засобів населення відрізняється хоча б від одного іншого середнього популяції.
Аналіз дисперсії - це метод перевірки відмінностей між засобами шляхом аналізу дисперсії. Тест заснований на двох оцінках дисперсії популяції (σ2). Одна оцінка називається середньою квадратною похибкою (MSE) і базується на відмінностях між балами всередині груп. MSEоцінюєσ2 незалежно від того, чи вірна нульова гіпотеза (засоби популяції рівні). Друга оцінка називається середнім квадратом між (MSB) і заснована на відмінностях між вибірковими засобами. MSBоцінює лише в томуσ2 випадку, якщо кошти населення рівні. Якщо кошти населення не рівні, тоMSB оцінює кількість більше, ніжσ2. Тому якщоMSB набагато більше, ніж наMSE, то кошти населення навряд чи будуть рівні. З іншого боку, якщо приблизно те ж самеMSE, то дані узгоджуються з нульовою гіпотезою про те, що засоби популяції рівні.MSB
Перш ніж приступити до розрахункуMSE іMSB, важливо врахувати припущення, зроблені ANOVA:
- Популяції мають однакову дисперсію. Це припущення називається припущеннямhomogeneity of variance.
- Популяції в нормі розподілені.
- Кожне значення відбирається незалежно один від одного значення. Це припущення вимагає, щоб кожен суб'єкт надавав лише одне значення. Якщо суб'єкт надає два бали, то значення не є незалежними. Аналіз даних з двома балами на предмет показаний у розділі, присвяченому темам ANOVA пізніше в цьому розділі.
Ці припущення такі ж, як і для t тесту відмінностей між групами, за винятком того, що вони застосовуються до двох або більше груп, а не тільки до двох груп.
Засоби та відхилення чотирьох груп у прикладі «Посмішки та поблажливість» наведені в табл15.3.1. Зверніть увагу, що в кожній з чотирьох умов є34 предмети (помилковий, Повстяний, Нещасний і Нейтральний).
Стан | Середнє | дисперсія |
---|---|---|
Помилковий | 5.3676 | 3.380 |
Повсть | 4.9118 | 2.8253 |
жалюгідний | 4.9118 | 2.1132 |
Нейтральний | 4.1176 | 2.3191 |
Розміри вибірки
Перші розрахунки в цьому розділі все припускають, що в кожній групі існує однакова кількість спостережень. Розрахунки нерівних розмірів вибірки наведені тут. Ми будемо посилатися на кількість спостережень у кожнійn групі як і загальну кількість спостережень якN. За цими даними існує чотири групи34 спостережень. Томуn=34 іN=136.
Обчислення MSE
Нагадаємо, що припущення однорідності дисперсії стверджує, що дисперсія всередині кожної з популяцій (σ2) однакова. Ця дисперсія - це величинаσ2, оціненаMSE і обчислюється як середнє значення відхилень вибірки. Для цих данихMSE значення дорівнює2.6489.
Обчислення MSB
Формула дляMSB заснована на тому, що дисперсія розподілу вибірки середнього
σ2M=σ2n
деn - розмір вибірки кожної групи. Переставляючи цю формулу, ми маємо
σ2=nσ2M
Тому, якби ми знали дисперсію розподілу вибірки середнього, ми могли б обчислити,σ2 помноживши її наn. Хоча ми не знаємо дисперсії розподілу вибірки середнього, ми можемо оцінити її з дисперсією засобів вибірки. Для даних поблажливості дисперсія чотирьох вибіркових засобів становить0.270. Для оцінкиσ2 множимо дисперсію вибіркового засобу (0.270) наn (кількість спостережень в кожній групі, яка є34). Ми знаходимо цеMSB=9.179.
Підсумовуємо наступні кроки:
- Обчислити кошти.
- Обчислити дисперсію засобів.
- Помножте дисперсію засобів наn.
Резюме
Якщо засоби населення рівні, то обидваMSE іMSB є оцінкамиσ2 і тому повинні бути приблизно однаковими. Природно, вони не будуть точно однаковими, оскільки вони є лише оцінками і базуються на різних аспектах даних:MSB обчислюється з вибіркових засобів, аMSE обчислюється з відхилень вибірки.
Якщо кошти населення не рівні, то все одноMSE оцінюватимуть,σ2 оскільки відмінності в чисельності населення не впливають на розбіжності. Однак відмінності в засобах популяції впливають,MSB оскільки відмінності між засобами населення пов'язані з відмінностями між вибірковими засобами. Звідси випливає, що чим більше відмінності між вибірковими засобами, тим більшеMSB.
Примітка
Коротше кажучи,MSE оцінює,σ2 чи рівні засоби населення, тоді якMSB оцінкиσ2 лише тоді, коли засоби населення рівні, і оцінює більшу кількість, коли вони не рівні.
Порівняння MSE та MSB
Критичним кроком в ANOVA є порівнянняMSE іMSB. ОскількиMSB оцінює більшу кількість, ніжMSE лише тоді, коли кошти населення не рівні, знахідка більшого,MSB ніж a,MSE є ознакою того, що засоби населення не рівні. Але оскількиMSB може бути більше, ніжMSE випадково, навіть якщо засоби населення рівні,MSB повинні бути набагато більшими, ніж дляMSE того, щоб виправдати висновок, що засоби населення відрізняються. Але скільки більше повинноMSB бути? Для даних «Посмішки і поблажливість»,MSB іMSE є9.179 і2.649, відповідно. Чи є ця різниця досить велика? Щоб відповісти, нам потрібно було б знати ймовірність того, що велика різниця або більша різниця, якби засоби населення були рівними. Математику, необхідну для відповіді на це питання, опрацьовував статистик Р.Фішер. Хоча оригінальна рецептура Фішера прийняла дещо іншу форму, стандартний метод визначення ймовірності заснований на співвідношенніMSB доMSE. Це співвідношення названо на честь Фішера і називаєтьсяF співвідношенням.
Для цих данихF співвідношення дорівнює
F=9.1792.649=3.465
Тому в3.465 разиMSB вище, ніжMSE. Чи могло б це статися, якби всі засоби населення були рівними? Це залежить від розміру вибірки. Маючи невеликий розмір вибірки, це не було б занадто дивно, оскільки результати невеликих зразків нестабільні. Однак при дуже великій вибірціMSB іMSE майже завжди приблизно однакові, іF співвідношення3.465 або більше було б дуже незвично. 15.3.1На малюнку показано розподіл вибіркиF для розміру вибірки в дослідженні «Посмішки та поблажливість». Як бачите, він має позитивний перекіс.

З15.3.1 малюнка ви можете бачити, щоF співвідношення3.465 або вище є незвичайними явищами. Площа праворуч від3.465 представляє ймовірністьF того, що великий або більший і дорівнює0.018. Іншими словами, враховуючи нульову гіпотезу, що всі засоби популяції рівні, значення ймовірності є,0.018 і тому нульова гіпотеза може бути відхилена. Висновок про те, що хоча б одне з засобів населення відрізняється хоча б від одного з інших, виправданий.
ФормаF розподілу залежить від розміру вибірки. Точніше, він залежить від двох параметрів ступеня свободи (df): один для чисельника (MSB) і один для знаменника (MSE). Нагадаємо, що ступені свободи для оцінки дисперсії дорівнюють числу спостережень мінус одиниця. Так якMSB це дисперсіяk засобів, вона маєk−1df. TheMSE є середнімk показником відхилень, кожен зn−1df. Томуdf дляMSE єk(n−1)=N−k, деN загальна кількість спостережень,n це кількість спостережень в кожній групі, іk це кількість груп. Підсумовуємо:
dfnumerator=k−1
dfdenominator=N−k
Для даних «Посмішки та поблажливість»,
dfnumerator=k−1=4−1=3
dfdenominator=N−k=136−4=132
F=3.465
КалькуляторF розподілу показує, щоp=0.018.
F Калькулятор
Однохвостий або два?
Чи є значення ймовірності зF коефіцієнта однохвостою або двоххвостою ймовірністю? У буквальному сенсі це однохвоста ймовірність, оскільки, як ви бачите на малюнку15.3.1, ймовірність - це область в правому хвості розподілу. ОднакF співвідношення чутливе до будь-якої закономірності відмінностей між засобами. Отже, це тест двоххвостої гіпотези і найкраще вважається двоххвостим тестом.
Відносини доt тесту
Оскільки тест ANOVA та незалежних груп можутьt перевірити різницю між двома засобами, вам може бути цікаво, який з них використовувати. На щастя, це не має значення, оскільки результати завжди будуть однаковими. Коли існує лише дві групи, такі відносини міжF і завждиt будуть триматися:
F(1,dfd)=t2(df)
деdfd - ступені свободи для знаменникаF тесту іdf - ступені свободи дляt тесту. dfdзавжди буде рівнимdf.
Джерела варіації
Чому бали в експерименті відрізняються один від одного? Розглянемо оцінки двох предметів у дослідженні «Усмішки та поблажливість»: один із стану «Помилкова посмішка» та один із стану «Посмішка відчувається». Очевидною можливою причиною того, що бали могли відрізнятися, є те, що до випробуваних ставилися по-різному (вони були в різних умовах і бачили різні подразники). Друга причина полягає в тому, що обидва суб'єкти, можливо, відрізнялися щодо своєї схильності поблажливо судити людей. Третя полягає в тому, що, можливо, один з випробовуваних був у поганому настрої після отримання низької оцінки на тесті. Ви можете собі уявити, що існує безліч інших причин, чому оцінки двох предметів можуть відрізнятися. Усі ці причини, крім першої (суб'єкти трактувалися по-різному) - це можливості, які не перебували під експериментальним дослідженням, і, отже, всі відмінності (варіації) через ці можливості незрозумілі. Традиційно називати незрозумілу помилку дисперсії, хоча немає ніякого натяку на те, що була допущена помилка. Тому варіацію в цьому експерименті можна вважати або варіацією через стан, в якому перебував суб'єкт, або через помилку (загальна сума всіх причин оцінки суб'єктів може відрізнятися, які не були виміряні).
Однією з важливих характеристик ANOVA є те, що вона розділяє варіацію на різні її джерела. У ANOVA термін сума квадратів (SSQ) використовується для позначення варіації. Загальна варіація визначається як сума квадратних відмінностей між кожним балом та середнім значенням усіх предметів. Середнє значення всіх суб'єктів називається великим середнім і позначається як ГМ. (Коли в кожній умові однакова кількість суб'єктів, велике середнє - це середнє значення умови означає.) Загальна сума квадратів визначається як
SSQtotal=∑(X−GM)2
що означає взяти кожен бал, відняти від нього велике середнє, квадрат різниці, а потім підсумувати ці квадратні значення. Для дослідження «Усмішки та поблажливість»,SSQtotal=377.19.
Умова суми квадратів обчислюється, як показано нижче.
SSQcondition=n[(M1−GM)2+(M2−GM)2+⋯+(Mk−GM)2]
деn - кількість балів в кожній групі,k це кількість груп,M1 це середнє значення дляCondition 1,M2 є середнім дляCondition 2, іMk є середнім дляCondition k. Для дослідження «Посмішки та поблажливість» цінностями є:
SSQcondition=34[(5.37−4.83)2+(4.91−4.83)2+(4.91−4.83)2+(4.12−4.83)2]=27.5
Якщо є нерівні розміри вибірки, то єдина зміна полягає в тому, що для умови суми квадратів використовується наступна формула:
SSQcondition=n1(M1−GM)2+n2(M2−GM)2+⋯+nk(Mk−GM)2
деni - розмір вибіркиith умови. SSQtotalобчислюється так само, як показано вище.
Похибка суми квадратів - це сума квадратів відхилень кожного балу від середнього його групового значення. Це можна записати як
SSQerror=∑(Xi1−M1)2+∑(Xi2−M2)2+⋯+∑(Xik−Mk)2
деXi1ith оцінка вgroup 1 іM1 є середнім дляgroup 1,Xi2 єith оцінка вgroup 2 іM2 є середнім для іgroup 2 т.д. для дослідження «Посмішки і поблажливість», засоби є:5.368,4.912,4.912, і 4.118. ОтжеSSQerror, це:
SSQerror=(2.5−5.368)2+(5.5−5.368)2+...+(6.5−4.118)2=349.65
Похибка суми квадратів також може бути обчислена відніманням:
SSQerror=SSQtotal−SSQcondition
SSQerror=377.189−27.535=349.65
Тому загальну суму квадратів377.19 можна розділити наSSQcondition(27.53) іSSQerror(349.66).
Після обчислення сум квадратів середні квадрати (MSBіMSE) можна легко обчислити. Формули такі:
MSB=SSQconditiondfn
деdfn - чисельник ступенів свободи і дорівнюєk−1=3.
MSB=27.5353=9.18
яке є тим самим значеннямMSB отриманого раніше (за винятком похибки округлення). Аналогічно,
MSE=SSQerrordfd
деdfd - ступені свободи для знаменника і дорівнюєN−k.
dfd=136−4=132
MSE=349.66/132=2.65
який такий же, як отриманий раніше (за винятком помилки округлення). Зверніть увагу, що частоdfd називають помилкоюdfe для ступенів свободи.
Аналіз дисперсії Зведена таблиця, показана нижче, є зручним способом узагальнити поділ дисперсії. Помилки округлення були виправлені.
Джерело | дф | SSQ | МС | F | р |
---|---|---|---|---|---|
Стан | 3 | 27.5349 | 9.1783 | 3.465 | 0.0182 |
Помилка | 132 | 349,6544 | 2.6489 | ||
Всього | 135 | 377.1893 |
Перший стовпець показує джерела варіації, другий стовпець показує ступені свободи, третій показує суми квадратів, четвертий показує середні квадрати, п'ятий показуєF співвідношення, а останній показує значення ймовірності. Зверніть увагу, що середні квадрати - це завжди суми квадратів, поділені на ступені свободи. FІp мають відношення тільки до Умови. Хоча середня квадратна сума може бути обчислена шляхом ділення суми квадратів на ступені свободи, вона, як правило, не представляє особливого інтересу і тут опускається.
Форматування даних для комп'ютерного аналізу
Більшість комп'ютерних програм, які обчислюють ANOVA, вимагають, щоб ваші дані були в певній формі. Розглянемо дані в табл15.3.3.
Група 1 | Група 2 | Група 3 |
---|---|---|
3 | 2 | 8 |
4 | 4 | 5 |
5 | 6 | 5 |
Тут є три групи, кожна з яких має три спостереження. Щоб відформатувати ці дані для комп'ютерної програми, зазвичай потрібно використовувати дві змінні: перша вказує групу, в якій знаходиться суб'єкт, а друга - сама оцінка. Переформатований варіант даних у таблиці15.3.3 наведено в табл15.3.4.
Г | У |
---|---|
1 | 3 |
1 | 4 |
1 | 5 |
2 | 2 |
2 | 4 |
2 | 6 |
3 | 8 |
3 | 5 |
3 | 5 |
Щоб використовувати Analysis Lab для виконання розрахунків, ви повинні скопіювати дані, а потім
- Натисніть кнопку «Ввести/Змінити дані». (Можливо, вас попереджають, що з міркувань безпеки ви повинні використовувати комбінацію клавіш для вставки даних.)
- Вставте свої дані.
- Натисніть «Прийняти дані».
- Встановіть залежну змінну в значенняY.
- Встановіть для змінної групування значенняG.
- Натисніть кнопку ANOVA.
Ви знайдете, щоF=1.5 іp=0.296.