Skip to main content
LibreTexts - Ukrayinska

13.2: Перевірка значущості коефіцієнта кореляції

  • Page ID
    100061
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Коефіцієнт кореляції\(r\), говорить нам про силу і напрямок лінійної залежності між\(X_1\) і\(X_2\).

    Вибіркові дані використовуються для обчислення\(r\) коефіцієнта кореляції для вибірки. Якби ми мали дані для всієї популяції, ми могли б знайти коефіцієнт кореляції населення. Але оскільки у нас є лише вибіркові дані, ми не можемо обчислити коефіцієнт кореляції населення. Коефіцієнт кореляції вибірки, r, є нашою оцінкою невідомого коефіцієнта кореляції населення.

    • Тест гіпотези дозволяє вирішити, чи є значення коефіцієнта кореляції населення\ rho «близьким до нуля» або «значно відрізняється від нуля». Ми вирішуємо це виходячи з\(r\) коефіцієнта кореляції вибірки та розміру вибірки\(n\).

      Якщо тест робить висновок, що коефіцієнт кореляції значно відрізняється від нуля, скажемо, що коефіцієнт кореляції «значний».

      • Що означають гіпотези в словах
        • Складання висновку Існує два методи прийняття рішення, що стосуються гіпотези. Тестова статистика для перевірки цієї гіпотези:

          \[t_{c}=\frac{r}{\sqrt{\left(1-r^{2}\right) /(n-2)}}\nonumber\]

          \[t_{c}=\frac{r \sqrt{n-2}}{\sqrt{1-r^{2}}}\nonumber\]

          Де друга формула є еквівалентною формою тестової статистики,\(n\) це розмір вибірки та ступені свободи\(n-2\). Це\(t\) -статистика і діє так само, як і інші\(t\) тести. Обчисліть\(t\) значення -value і порівняйте це з критичним значенням з\(t\) -таблиці при відповідних ступенях свободи та рівні впевненості, яку ви хочете зберегти. Якщо обчислене значення знаходиться в хвості, то не може прийняти нульову гіпотезу про відсутність лінійної залежності між цими двома незалежними випадковими величинами. Якщо обчислене\(t\) значення НЕ знаходиться в хвостаті, то не може відхилити нульову гіпотезу про відсутність лінійної залежності між двома змінними.

          Швидким скороченим способом перевірки кореляцій є зв'язок між розміром вибірки та кореляцією. Якщо:

          \[|r| \geq \frac{2}{\sqrt{n}}\nonumber\]

          то це означає, що кореляція між двома змінними демонструє, що лінійна залежність існує і є статистично значущою приблизно на рівні 0,05 значущості. Як вказує формула, існує зворотна залежність між розміром вибірки та необхідною кореляцією для значущості лінійної залежності. При наявності лише 10 спостережень необхідна кореляція значущості становить 0,6325, для 30 спостережень необхідна кореляція значущості зменшується до 0,3651, а при 100 спостереженнях необхідний рівень становить всього 0,2000.

          Кореляції можуть бути корисними для візуалізації даних, але не використовуються належним чином для «пояснення» зв'язку між двома змінними. Мабуть, жодна статистика не використовується більш неправильно, ніж коефіцієнт кореляції. Посилаючись на кореляції між станом здоров'я та всім, від місця проживання до кольору очей, має на увазі причинно-наслідковий зв'язок. Цього просто неможливо досягти за допомогою коефіцієнта кореляції. Коефіцієнт кореляції, звичайно, невинний в цьому неправильному тлумаченні. Обов'язок аналітика - використовувати статистику, яка призначена для перевірки причинно-наслідкових зв'язків і повідомляти лише про ті результати, якщо вони мають намір зробити таку претензію. Проблема полягає в тому, що пройти цей більш суворий тест важко, тому ліниві та/або недобросовісні «дослідники» відкидаються на кореляції, коли вони не можуть зробити свою справу законно.