12.6: Передбачення
- Page ID
- 98354
Згадаймо третій приклад іспиту/випускного іспиту. Ми розглянули графік розкиду і показали, що коефіцієнт кореляції значний. Ми знайшли рівняння найкращої лінії для підсумкового іспиту як функція оцінки на третьому іспиті. Тепер ми можемо використовувати лінію регресії найменших квадратів для прогнозування.
Припустимо, ви хочете оцінити, або передбачити, середній підсумковий бал за статистикою студентів, які отримали 73 на третьому іспиті. Результати іспиту (\(x\)-значення) варіюються від 65 до 75. Оскільки 73 знаходиться між\(x\) -значеннями 65 і 75,\(x = 73\) підставляємо в рівняння. Потім:
\[\hat{y} = -173.51 + 4.83(73) = 179.08\nonumber \]
Ми прогнозуємо, що студенти статистики, які заробляють 73 бал на третьому іспиті, в середньому отримають оцінку 179,08 на підсумковому іспиті.
Приклад\(\PageIndex{1}\)
Згадаймо третій приклад іспиту/випускного іспиту.
- Що б ви передбачили підсумковий бал іспиту для студента, який набрав 66 на третьому іспиті?
- Що б ви передбачили підсумковий бал іспиту для студента, який набрав 90 на третьому іспиті?
Відповідь
а. 145,27
б\(x\) Значення в даних знаходяться між 65 і 75. Дев'яносто знаходиться за межами області спостережуваних\(x\) значень в даних (незалежна змінна), тому ви не можете достовірно передбачити підсумковий бал іспиту для цього студента. (Незважаючи на те, що можна ввести 90 в рівняння\(x\) і обчислити відповідне\(y\) значення,\(y\) значення, яке ви отримаєте, не буде надійним.)
Щоб зрозуміти дійсно, наскільки ненадійним може виявитися прогноз поза спостережуваних\(x\) -значень, що спостерігаються в даних, зробіть підстановку\(x = 90\) в рівняння.
\[\hat{y} = -173.51 + 4.83(90) = 261.19\nonumber \]
За прогнозами, підсумковий бал іспиту складе 261,19. Найбільший бал підсумкового іспиту може бути 200.
Процес прогнозування всередині спостережуваних\(x\) значень, що спостерігаються в даних, називається інтерполяцією. Процес прогнозування поза спостережуваних\(x\) -значень, що спостерігаються в даних, називається екстраполяцією.
Вправа\(\PageIndex{1}\)
Збираються дані про взаємозв'язок між кількістю годин на тиждень занять музичним інструментом і балами на тесті з математики. Лінія best fit виглядає наступним чином:
\[\hat{y} = 72.5 + 2.8x \nonumber \]
Що б ви передбачили, що бал на математичному тесті буде для студента, який практикує музичний інструмент протягом п'яти годин на тиждень?
- Відповідь
-
86.5
Резюме
Після визначення наявності сильного коефіцієнта кореляції та обчислення лінії найкращого підгонки, ви можете використовувати лінію регресії найменших квадратів, щоб робити прогнози щодо ваших даних.
Посилання
- Дані Центрів контролю та профілактики захворювань.
- Дані Національного центру профілактики ВІЛ, ЗПСШ та туберкульозу.
- Дані Бюро перепису населення США. Доступний в Інтернеті за адресою www.census.gov/compendia/stat... atalities.html
- Дані Національного центру статистики охорони здоров'я.