12.6: Конкретні порівняння
- Page ID
- 98048
Цілі навчання
- Визначення лінійної комбінації
- Вкажіть лінійну комбінацію через коефіцієнти
- Зробіть тест на значущість для конкретного порівняння
Існує багато ситуацій, в яких порівняння між засобами є більш складними, ніж просто порівняння одного середнього з іншим. У цьому розділі показано, як перевірити ці більш складні порівняння. Методи в цьому розділі припускають, що порівняння між засобами було вирішено перед переглядом даних. Тому ці порівняння називаються плановими порівняннями. Інша процедура необхідна для незапланованих порівнянь.
Почнемо з вигаданих даних гіпотетичного експерименту, показаного в табл\(\PageIndex{1}\). Дванадцять суб'єктів були обрані з популяції суб'єктів високої самооцінки (\(esteem = 1\)), а додаткові\(12\) суб'єкти були обрані з популяції суб'єктів низької самооцінки (\(esteem = 2\)). Суб'єкти потім виконували завдання і (незалежно від того, наскільки добре вони дійсно зробили) половині в кожній категорії поваги сказали, що вони досягли успіху (\(outcome = 1\)), а іншій половині сказали, що вони не вдалося (\(outcome = 2\)). Тому було шість предметів у кожній з чотирьох комбінацій шану/результат та\(24\) предметів у всіх.
Після виконання завдання суб'єктам було запропоновано оцінити (за\(10\) -бальною шкалою), скільки їх результату (успіх чи невдача) вони приписують собі, а не через характер завдання.
| результат | шанувати | атрибут |
|---|---|---|
| 1 | 1 | 7 |
| 1 | 1 | 8 |
| 1 | 1 | 7 |
| 1 | 1 | 8 |
| 1 | 1 | 9 |
| 1 | 1 | 5 |
| 1 | 2 | 6 |
| 1 | 2 | 5 |
| 1 | 2 | 7 |
| 1 | 2 | 4 |
| 1 | 2 | 5 |
| 1 | 2 | 6 |
| 2 | 1 | 4 |
| 2 | 1 | 6 |
| 2 | 1 | 5 |
| 2 | 1 | 4 |
| 2 | 1 | 7 |
| 2 | 1 | 3 |
| 2 | 2 | 9 |
| 2 | 2 | 8 |
| 2 | 2 | 9 |
| 2 | 2 | 8 |
| 2 | 2 | 7 |
| 2 | 2 | 6 |
Засоби чотирьох умов наведені в табл\(\PageIndex{2}\).
| Результат | Повага | Середнє |
|---|---|---|
| Успіх | Висока самооцінка | 7.333 |
| Низька самооцінка | 5.500 | |
| Невдача | Висока самооцінка | 4.833 |
| Низька самооцінка | 7,833 |
Є кілька запитань, які ми можемо задати щодо даних. Ми починаємо з того, що запитуємо, чи в середньому суб'єкти, яким сказали, що вони досягли успіху, суттєво відрізнялися від суб'єктів, яким сказали, що вони не змогли. Засоби для суб'єктів, які перебувають у стані успіху, призначені\(7.333\) для суб'єктів високої самооцінки та\(5.500\) для суб'єктів з низькою самооцінкою. Тому середнє значення для всіх суб'єктів в стані успіху є\(\tfrac{7.3333 + 5.5000}{2} = 6.4167\). Аналогічно, середнє значення для всіх суб'єктів в стані відмови є\(\tfrac{4.8333 + 7.8333}{2} = 6.3333\). Питання в тому, як ми робимо тест на значущість для цієї різниці\(6.4167-6.3333 = 0.083\)?
Насамперед необхідно висловити цю різницю в терміні лінійної комбінації за допомогою набору коефіцієнтів і засобів. Це може здатися складним, але це дійсно досить легко. Ми можемо обчислити середнє значення умов успіху, множивши кожне середнє значення успіху,\(0.5\) а потім додаючи результат. Іншими словами, ми обчислюємо
\[(0.5)(7.333) + (0.5)(5.500)= 3.67 + 2.75= 6.42\]
Аналогічно, ми можемо обчислити середнє значення умов відмови, множивши кожне значення «невдачі»,\(0.5\) а потім додаючи результат:
\[(0.5)(4.833) + (0.5)(7.833)= 2.417 + 3.917= 6.33\]
Різниця між двома засобами може бути виражена як
\[0.5 \times 7.333 + 0.5 \times 5.500 -(0.5 \times 4.833 + 0.5 \times 7.833) = 0.5 \times 7.333 + 0.5 \times 5.500 - 0.5 \times 4.833 - 0.5 \times 7.833\]
Тому ми можемо обчислити різницю між середнім значенням «успіх» та «невдачею», множивши кожен «успіх» означає\(0.5\), кожен невдача означає\(-0.5\), і додаючи результати. У таблиці\(\PageIndex{3}\) стовпчик коефіцієнта - це множник, а стовпець добутку - результат множення. Якщо скласти чотири значення в стовпці продукту, ми отримаємо
\[L = 3.667 + 2.750 - 2.417 - 3.917 = 0.083\]
Це те саме значення, яке ми отримали, коли ми обчислювали різницю між засобами раніше (в межах помилки округлення). Викликаємо значення "\(L\)" для «лінійної комбінації.»
| Результат | Повага | Середнє | Коефф | Продукт |
|---|---|---|---|---|
| Успіх | Висока самооцінка | 7.333 | 0.5 | 3.667 |
| Низька самооцінка | 5.500 | 0.5 | 2.750 | |
| Невдача | Висока самооцінка | 4.833 | -0.5 | -2.417 |
| Низька самооцінка | 7,833 | -0.5 | -3.917 |
Тепер питання полягає в тому, чи суттєво\(L\) відрізняється наша цінність від\(0\). Загальна формула\(L\) для
\[L=\sum c_iM_i\]
де\(c_i\) -\(i_{th}\) коефіцієнт і\(M_i\) є\(i_{th}\) середнім. Як показано вище,\(L = 0.083\). Формула тестування\(L\) на значущість показана нижче:
\[t=\cfrac{L}{\sqrt{\cfrac{\sum c_{i}^{2}MSE}{n}}}\]
У цьому прикладі
\[\sum c_i^2 = 0.5^2 + 0.5^2 + (-0.5)^2 + (-0.5)^2 = 1.00\]
\(MSE\)це середнє значення відхилень. Чотири дисперсії наведені в табл\(\PageIndex{4}\). Їх середнє значення є\(1.625\). Тому\(MSE = 1.625\).
| Результат | Повага | дисперсія |
|---|---|---|
| Успіх | Висока самооцінка | 1.867 |
| Низька самооцінка | 1.100 | |
| Невдача | Висока самооцінка | 2.167 |
| Низька самооцінка | 1.367 |
Значення n - кількість суб'єктів у кожній групі. Ось\(n = 6\).
Збираючи все воєдино,
\[t= \cfrac{0.083}{\sqrt{\cfrac{(1)(1.625)}{6}}} = 0.16\]
Нам потрібно знати ступені свободи, щоб обчислити значення ймовірності. Ступінь свободи - це
\[df = N - k\]
де\(N\) - загальна кількість суб'єктів (\(24\)) і\(k\) - кількість груп (\(4\)). Тому,\(df = 20\). Використовуючи онлайн-калькулятор, ми знаходимо, що значення двоххвостої ймовірності є\(0.874\). Тому різниця між умовою «успіх» і умовою «невдача» не суттєва.
t калькулятор розподілу
Більш цікаве питання про результати полягає в тому, чи відрізняється ефект результату (успіх чи невдача) залежно від самооцінки суб'єкта. Наприклад, успіх може змусити суб'єктів з високою самооцінкою частіше приписувати результат собі, тоді як успіх може зробити суб'єктів з низькою самооцінкою менше шансів приписувати результат собі.
Щоб перевірити це, ми повинні перевірити різницю між відмінностями. Зокрема, чи відрізняється різниця між результатами успіху та невдачі для суб'єктів з високою самооцінкою від різниці між успіхом та результатами невдачі для суб'єктів з низькою самооцінкою? Засоби, наведені в таблиці 5, показують, що це так. Для суб'єктів з високою самооцінкою різниця між оцінками атрибуції успіху та невдачі є\(7.333-4.833 = 2.500\). Для суб'єктів з низькою самооцінкою різниця є\(5.500-7.833 = -2.333\). Різниця між відмінностями є\(2.500 - (-2.333) = 4.833\).
Коефіцієнти для перевірки цієї різниці між відмінностями наведені в табл\(\PageIndex{5}\).
| Самооцінка | Результат | Середнє | Коефф | Продукт |
|---|---|---|---|---|
| Високі | Успіх | 7.333 | 1 | 7.333 |
| Невдача | 4.833 | -1 | -4.833 | |
| Низький | Успіх | 5.500 | -1 | -5.500 |
| Невдача | 7,833 | 1 | 7.83 |
Якщо важко зрозуміти, звідки взялися ці коефіцієнти, вважайте, що наша різниця між відмінностями була обчислена таким чином:
\[\begin{align*} (7.33 - 4.83) - (5.50 - 7.83) &= 7.33 - 4.83 - 5.50 + 7.83\\ &= (1)7.33 + (-1)4.83 + (-1)5.50 + (1)7.83 \end{align*}\]
Значення в дужках - це коефіцієнти.
Щоб продовжити розрахунки,
\[L=4.83\]
\[\sum c_i^2 = 1^2 + (-1)^2 + (-1)^2 + 1^2 = 4.00\]
\[t= \cfrac{4.83}{\sqrt{\cfrac{(4)(1.625)}{6}}} = 4.64\]
Двоххвосте\(p\) значення є\(0.0002\). Тому різниця між відмінностями вельми істотна.
У наступному розділі, присвяченому аналізу дисперсії, ви побачите, що такі порівняння перевіряють те, що називається взаємодією. Взагалі, відбувається взаємодія, коли ефект однієї змінної відрізняється в залежності від рівня іншої змінної. У цьому прикладі ефект змінної результату відрізняється залежно від самооцінки суб'єкта. Для суб'єктів з високою самооцінкою успіх призвів до більшої самоатрибуції, ніж невдачі; для суб'єктів з низькою самооцінкою успіх призвів до меншої самоатрибуції, ніж невдача.
Кілька порівнянь
Чим більше порівнянь ви зробите, тим більше ваш шанс на помилку типу I. Корисно розрізняти два частоти помилок:
- коефіцієнт помилок для порівняння та
- частота помилок у сімейному відношенні
Частота помилок порівняння - це ймовірність помилки типу I для конкретного порівняння. Частота помилок у сімейному відношенні - це ймовірність зробити одну або кілька помилок типу I у сім'ї або наборі порівнянь. В експерименті з атрибуцією, розглянутому вище, ми обчислили два порівняння. Якщо ми використовуємо\(0.05\) рівень для кожного порівняння, то швидкість порівняння просто\(0.05\). Сімейний тариф може бути складним. На щастя, існує просте наближення, яке є досить точним, коли кількість порівнянь невелика. Визначаючи\(\alpha\) як коефіцієнт помилок для порівняння та\(c\) як кількість порівнянь, наступна нерівність завжди відповідає дійсності для сімейного коефіцієнта помилок (\(FW\)):
\[FW \leq c\alpha\]
Ця нерівність називається нерівністю Бонферроні. На практиці\(FW\) можна наблизити по\(c\alpha\). Це консервативне наближення, оскільки ніколи не\(FW\) може бути більшим\(c\alpha\) і, як правило, менше\(c\alpha\).
Нерівність Бонферроні може бути використана для контролю частоти помилок у сімейному відношенні наступним чином: Якщо ви хочете\(\alpha\), щоб рівень помилок у сім'ї був, ви використовуєте\(\alpha /c\) як коефіцієнт помилок для порівняння. Ця корекція, яка називається корекцією Бонферроні, як правило, призведе до сімейного рівня помилок менше, ніж\(\alpha\). Крім того, ви можете помножити значення ймовірності на\(c\) і використовувати початковий\(\alpha\) рівень.
Чи слід контролювати рівень помилок у сімейному відношенні? На жаль, чіткої відповіді на це питання немає. Недоліком контролю частоти помилок сімейного є те, що це ускладнює отримання значного результату для будь-якого даного порівняння: чим більше порівнянь ви робите, тим нижчим повинен бути коефіцієнт порівняння і, отже, важче досягти значущості. Тобто потужність нижча, коли ви контролюєте частоту помилок сімейного характеру. Перевага полягає в тому, що у вас менше шансів зробити помилку типу I.
Одним з міркувань є визначення сімейства порівнянь. Припустимо, ви провели дослідження, в якому вас цікавило, чи була різниця між малюками чоловічої та жіночої статі в тому віці, в якому вони почали повзати. Після того, як ви закінчили аналізувати дані, у вашого колеги виникло зовсім інше дослідницьке питання: чи відрізняються діти, які народжуються взимку, від тих, хто народився влітку у віці, який вони починають повзати? Чи слід контролювати сімейну норму або вона повинна бути дозволена бути більшою, ніж\(0.05\)? Наша думка полягає в тому, що немає жодної причини, що ви повинні бути покарані (меншою владою) тільки тому, що ваш колега використовував ті ж дані для вирішення іншого дослідницького питання. Тому рівень помилок сімейного характеру не потрібно контролювати. Розглянемо два порівняння, зроблені на прикладі атрибуції на початку цього розділу: Ці порівняння перевіряють абсолютно різні гіпотези. Тому контролювати сімейну ставку не потрібно.
Тепер розглянемо дослідження, призначене для дослідження взаємозв'язку між різними змінними та здатністю суб'єктів прогнозувати результат перевороту монети. Одне порівняння - між чоловіками та жінками; друге порівняння - між тими, хто старше\(40\) та молодше\(40\); третє - між вегетаріанцями та невегетаріанцями; а четверте - між первістками та іншими. Питання про те, чи перевіряють ці чотири порівняння різні гіпотези, залежить від вашої точки зору. З одного боку, немає нічого про те, чи має вік різницю, пов'язану з тим, чи дієта має значення. У цьому сенсі порівняння стосуються різних гіпотез. З іншого боку, цілу серію порівнянь можна розглядати як вирішення загального питання про те, чи впливає щось на здатність передбачати результат перевертання монети. Якщо нічого не робить, то дозволити сімейному ставці бути високим означає, що існує велика ймовірність досягти неправильного висновку.
Ортогональні порівняння
У попередніх розділах ми говорили про те, що порівняння є незалежними. Незалежні порівняння часто називають ортогональними порівняннями. Існує простий тест, щоб визначити, чи є два порівняння ортогональними: Якщо сума добутків коефіцієнтів дорівнює 0, то порівняння ортогональні. Розглянемо ще раз експеримент по приписуванню успіху або невдачі. У таблиці\(\PageIndex{6}\) наведені коефіцієнти, раніше представлені в\(\PageIndex{3}\) табл\(\PageIndex{5}\). У графі "\(C1\)" містяться коефіцієнти з порівняння, наведеного в таблиці\(\PageIndex{3}\); графа "\(C2\)" містить коефіцієнти з порівняння, наведеного в табл\(\PageIndex{5}\). Стовпець з написом «Продукт» є твором цих двох стовпців. Зверніть увагу, що сума чисел у цьому стовпці дорівнює\(0\). Тому два порівняння ортогональні.
| Результат | Повага | С1 | C2 | Продукт |
|---|---|---|---|---|
| Успіх | Висока самооцінка | 0.5 | 1 | 0.5 |
| Низька самооцінка | 0.5 | -1 | -0.5 | |
| Невдача | Висока самооцінка | -0.5 | -1 | 0.5 |
| Низька самооцінка | -0.5 | 1 | -0.5 |
Таблиця\(\PageIndex{7}\) показує два порівняння, які не є ортогональними. Перший порівнює суб'єкти високої самооцінки з суб'єктами низької самооцінки; другий розглядає лише тих, хто входить до групи успіху, і порівнює суб'єкти високої самооцінки з суб'єктами низької самооцінки. Група відмов ігнорується, використовуючи в\(0's\) якості коефіцієнтів. Зрозуміло, що порівняння цих двох груп предметів для всієї вибірки не є незалежним від їх порівняння лише для групи успіху. Можна помітити, що сума добутків коефіцієнтів є\(0.5\) і немає\(0\).
| Результат | Повага | С1 | C2 | Продукт |
|---|---|---|---|---|
| Успіх | Висока самооцінка | 0.5 | 0.5 | 0,25 |
| Низька самооцінка | -0.5 | -0.5 | 0,25 | |
| Невдача | Висока самооцінка | 0.5 | 0.0 | 0.0 |
| Низька самооцінка | -0.5 | 0.0 | 0.0 |
