10: Кореляція та регресія
- Page ID
- 97873
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)
Наш інтерес до цієї глави полягає в ситуаціях, в яких ми можемо пов'язати з кожним елементом популяції або вибірки два вимірювання\(x\) і y, особливо в тому випадку, якщо це цікаво використовувати значення для прогнозування значення y Наприклад, населення може бути повітря в\(x\) автомобільні гаражі,\(x\) може бути електричний струм, вироблений електрохімічною реакцією, що відбувається в лічильнику чадного газу, і\(y\) концентрація чадного газу в повітрі. У цьому розділі ми дізнаємося статистичні методи аналізу взаємозв'язку між змінними\(x\) і\(y\) в цьому контексті.
- 10.1: Лінійні зв'язки між змінними
- У цьому розділі ми проаналізуємо ситуації, в яких змінні x і y виявляють лінійну залежність з деякою випадковістю. Рівень випадковості буде варіюватися від ситуації до ситуації.
- 10.2: Коефіцієнт лінійної кореляції
- Коефіцієнт лінійної кореляції вимірює силу і напрямок лінійної залежності між двома змінними x і y, а знак коефіцієнта лінійної кореляції вказує напрямок лінійної залежності між x і y.
- 10.3: Моделювання лінійних зв'язків з наявністю випадковості
- Для будь-яких статистичних процедур, наведених у цій книзі або в іншому місці, пов'язані формули дійсні лише за конкретних припущень. Сукупність припущень в простій лінійній регресії є математичним описом співвідношення між x і y, такий набір припущень відомий як модель. Статистичні процедури дійсні лише тоді, коли певні припущення дійсні.
- 10.4: Лінія регресії найменших квадратів
- Наскільки добре пряма відповідає набору даних, вимірюється сумою квадратних похибок. Лінія регресії найменших квадратів - це лінія, яка найкраще підходить для даних. Його нахил і y-перехоплення обчислюються за даними за допомогою формул. Нахил лінії регресії найменших квадратів оцінює розмір і напрямок середньої зміни залежної змінної y при збільшенні незалежної змінної x на одну одиницю.
- 10.5: Статистичні висновки про β
- Параметр β, нахил лінії регресії населення, має першорядне значення в регресійному аналізі, оскільки він дає справжню швидкість зміни середнього E (y) у відповідь на одиничне збільшення змінної предиктора x.
- 10.6: Коефіцієнт визначення
- Коефіцієнт детермінації оцінює частку мінливості в змінній y, що пояснюється лінійним співвідношенням між y і змінною x. Вибір того, який з них використовувати, може базуватися на тому, які величини вже обчислені до цих пір.
- 10.7: Оцінка та прогнозування
- Коефіцієнт детермінації оцінює частку мінливості в змінній y, що пояснюється лінійним співвідношенням між y і змінною x. існує кілька формул для обчислення коефіцієнта детермінації; вибір якої з них використовувати можна виходячи з того, які величини мають вже обчислено до цих пір.
- 10.8: Повний приклад
- У цьому розділі ми розглянемо повний приклад використання кореляційного та регресійного аналізу даних від початку до кінця, торкаючись послідовно всіх тем цієї глави.