10.2: Ступені свободи
Цілі навчання
- Визначте ступені свободи
- Оцініть відхилення від вибірки,1 якщо відомо середнє значення популяції
- Створіть, чому відхилення від середнього зразка не є самостійними
- Створіть загальну формулу ступенів свободи через кількість значень і кількість оцінюваних параметрів
- Обчислітьs2
Деякі оцінки базуються на більшій кількості інформації, ніж інші. Наприклад, оцінка дисперсії на основі розміру вибірки100 базується на більшій кількості інформації, ніж оцінка дисперсії на основі розміру вибірки5. Ступінь свободи (df) оцінки - це кількість незалежних частин інформації, на яких базується оцінка.
Як приклад, скажімо, що ми знаємо, що середня висота марсіан є6 і бажають оцінити дисперсію їх висот. Ми випадковим чином відбираємо одного марсіанина і виявляємо, що його висота є8. Нагадаємо, що дисперсія визначається як середнє квадратичне відхилення значень від їх середньої чисельності. Ми можемо обчислити квадратне відхилення нашого значення8 від середнього популяції,6 щоб знайти одне квадратне відхилення від середнього. Це одинарне квадратне відхилення від середнього(8−6)2=4, є оцінкою середнього квадратного відхилення для всіх марсіан. Тому, виходячи з цієї вибірки, ми б оцінили, що дисперсія популяції є4. Ця оцінка базується на єдиній частині інформації і, отже, має1df. Якби ми вибрали інший марсіанин і отримали висоту5, то ми могли б обчислити другу оцінку дисперсії,(5−6)2=1. Потім ми могли б усереднити наші дві оцінки (4і1), щоб отримати оцінку2.5. Оскільки ця оцінка базується на двох незалежних частиках інформації, вона має два ступені свободи. Ці дві оцінки є незалежними, оскільки вони базуються на двох незалежно та випадково відібраних марсіан. Оцінки не були б незалежними, якби після відбору одного марсіанина ми вирішили вибрати свого брата своїм другим марсіанином.
Як ви, напевно, думаєте, досить рідко ми знаємо, що населення означає, коли ми оцінюємо дисперсію. Натомість ми повинні спочатку оцінити середнє значення популяції (μ) за допомогою вибіркового середнього (M). Процес оцінки середнього впливає на наші ступені свободи, як показано нижче.
Повертаючись до нашої проблеми оцінки дисперсії в марсіанських висотах, припустимо, що ми не знаємо середнього значення чисельності населення, і тому ми повинні оцінити його з вибірки. Ми вибрали двох марсіан і виявили, що їх висоти є8 і5. MТому наша оцінка чисельності населення означає,
M=(8+5)2=6.5
Тепер ми можемо обчислити дві оцінки дисперсії:
- кошторис1=(8−6.5)2=2.25
- кошторис2=(5−6.5)2=2.25
Тепер щодо ключового питання: чи є ці дві оцінки незалежними? Відповідь ні, тому що кожна висота сприяла розрахункуM. Оскільки перший марсіанський зріст8 вплинувM, це також вплинуло на оцінку2. Якби перша висота була, наприклад10, то булаM б7.5 і оцінка була2 б(5−7.5)2=6.25 замість2.25. Важливим моментом є те, що дві оцінки не є незалежними, і тому ми не маємо двох ступенів свободи. Ще один спосіб думати про ненезалежність - вважати, що якби ви знали середнє значення і один з балів, ви б знали інший рахунок. Наприклад, якщо один бал є5 і середнє значення6.5, ви можете обчислити, що загальна сума двох балів є13 і, отже, що інший бал повинен бути13−5=8.
В цілому ступені свободи для оцінки дорівнюють числу значень мінус кількість параметрів, оцінених на шляху до розглянутої кошторису. У марсіанському прикладі є два значення (8і5), і ми повинні були оцінити один параметр (μ) на шляху до оцінки цікавить параметра (σ2). Тому оцінка дисперсії має2−1=1 ступінь свободи. Якби ми12 вибрали марсіан, то наша оцінка дисперсії мала б11 ступені свободи. Тому ступені свободи оцінки дисперсії дорівнюють томуN−1, деN знаходиться кількість спостережень.
Нагадаємо з розділу про мінливість, що формула оцінки дисперсії в вибірці така:
s2=∑(X−M)2N−1
Знаменником цієї формули є ступені свободи.