14.4: Стандартна помилка кошторису
Цілі навчання
- Складіть судження про розмір стандартної похибки кошторису з розкидного графіка
- Обчислити стандартну похибку оцінки на основі похибок прогнозування
- Обчислити стандартну помилку, використовуючи кореляцію Пірсона
- Оцініть стандартну похибку кошторису на основі вибірки
14.4.1На малюнку показані два приклади регресії. Ви можете бачити, що вGraph A, точки знаходяться ближче до лінії, ніж вони знаходяться вGraph B. Тому прогнози в більшGraph A точні, ніж вGraph B.

Стандартна похибка оцінки - міра точності прогнозів. Нагадаємо, що лінія регресії - це лінія, яка мінімізує суму квадратних відхилень прогнозування (також називається помилкою суми квадратів). Стандартна похибка кошторису тісно пов'язана з цією величиною і визначається нижче:
σest=√∑(Y−Y′)2N
деσest стандартна похибка оцінки,Y є фактичним балом,Y′ є прогнозованим балом, іN є кількістю пар балів. Чисельник - це сума квадратних відмінностей між фактичними балами та прогнозованими балами.
Відзначимо схожість формулиσest для з формулою для σ. Виходить, що σ est - це стандартне відхилення похибок прогнозування (кожнаY−Y′ - похибка прогнозування).
Припустимо, що дані в таблиці14.4.1 є даними з популяції з п'ятиXY пар.
Х | У | Y' | Y-Y' | (Y-Y') 2 | |
---|---|---|---|---|---|
1.00 | 1.00 | 1.210 | -0.210 | 0,044 | |
2.00 | 2.00 | 1,635 | 0,365 | 0.133 | |
3.00 | 1.30 | 2.060 | -0.760 | 0,578 | |
4.00 | 3.75 | 2.485 | 1.265 | 1.600 | |
5.00 | 2.25 | 2.910 | -0.660 | 0,436 | |
Сума | 15.00 | 10.30 | 10.30 | 0.000 | 2.791 |
Останній стовпець показує, що сума квадратів похибок прогнозування дорівнює2.791. Тому стандартна похибка кошторису становить
σest=√2.7915=0.747
Існує версія формули стандартної помилки з точки зору кореляції Пірсона:
σest=√(1−ρ)2SSYN
деρ - популяційна цінність кореляції Пірсона іSSY
SSY=∑(Y−μY)2
Для даних у таблиці14.4.1μY=2.06,SSY=4.597 іρ=0.6268. Тому,
σest=√(1−0.62682)(4.597)5=√2.7915=0.747
яке є тим самим значенням, обчисленим раніше.
Подібні формули використовуються, коли стандартна похибка оцінки обчислюється з вибірки, а не сукупності. Різниця лише в тому, що знаменник - цеN−2 скоріше ніжN. ПричинаN−2 використовується, а не вN−1 тому, що два параметри (нахил і перехоплення) були оцінені для того, щоб оцінити суму квадратів. Формули для вибірки, порівнянної з тими для популяції, наведені нижче.
sest=√∑(Y−Y′)2N−2
sest=√2.7913=0.964
sest=√(1−r)2SSYN−2