14: Регресія
Статистиків часто закликають розробляти методи прогнозування однієї змінної з інших змінних. Наприклад, можна передбачити середній бал балів коледжу від середнього балу середньої школи. Або, можливо, захочете передбачити дохід від кількості років освіти.
- 14.3: Розбиття сум квадратів
- Одним із корисних аспектів регресії є те, що вона може розділити варіацію у Y на дві частини: варіацію прогнозованих балів та варіацію помилок прогнозування. Варіація Y називається сумою квадратів Y і визначається як сума квадратних відхилень Y від середнього Y.
- 14.4: Стандартна помилка кошторису
- Стандартна похибка оцінки - міра точності прогнозів. Нагадаємо, що лінія регресії - це лінія, яка мінімізує суму квадратних відхилень прогнозування (також називається помилкою суми квадратів). Стандартна похибка кошторису тісно пов'язана з цією величиною і визначається нижче:
- 14.5: Вихідні статистичні дані для b і r
- У цьому розділі показано, як проводити тести на значущість та обчислювати довірчі інтервали для нахилу регресії та кореляції Пірсона. Як ви побачите, якщо нахил регресії істотно відрізняється від нуля, то коефіцієнт кореляції також істотно відрізняється від нуля.
- 14.6: Впливові спостереження
- Цілком можливо, що одне спостереження має великий вплив на результати регресійного аналізу. Тому важливо бути пильним до можливості впливових спостережень та враховувати їх при інтерпретації результатів.