4.5: Обчислення
- Page ID
- 98290
Цілі навчання
- Визначте\(X\) і\(x\)
- Створіть\(\sum xy=0\), чому, коли немає стосунків
- Розрахувати\(r\)
Існує кілька формул, за допомогою яких можна обчислити кореляцію Пірсона. Деякі формули мають більш концептуальний сенс, тоді як інші простіше насправді обчислювати. Ми почнемо з формули, яка має більш концептуальний сенс.
Ми збираємося обчислити кореляцію між змінними\(X\) і\(Y\) показано в табл\(\PageIndex{1}\). Почнемо з обчислення середнього значення для\(X\) і віднімання цього середнього значення з усіх значень\(X\). Нова змінна називається "\(x\)». Змінна\(y\) "" обчислюється аналогічно. \(y\)Змінні\(x\) і, як кажуть, бали відхилення, оскільки кожен бал є відхиленням від середнього. Зверніть увагу, що засоби\(x\) і\(y\) є обидва\(0\). Далі створюємо новий стовпець шляхом множення\(x\) і\(y\).
Перш ніж приступити до розрахунків, розглянемо, чому сума\(xy\) стовпця виявляє взаємозв'язок між\(X\) і\(Y\). Якби не було зв'язку між\(X\) і\(Y\), то позитивні значення були\(x\) б так само ймовірно, щоб бути в парі з від'ємними значеннями,\(y\) як і з позитивними значеннями. Це зробить негативні значення настільки ж\(xy\) ймовірними, як позитивні значення, і сума буде невеликою. З іншого боку, розглянемо таблицю 1, в якій високі значення\(X\) пов'язані з високими значеннями\(Y\) і низькими значеннями\(X\) пов'язані з низькими значеннями\(Y\). Ви можете бачити, що позитивні значення\(x\) пов'язані з позитивними значеннями,\(y\) а від'ємні значення\(x\) пов'язані з від'ємними значеннями\(y\). У всіх випадках добуток\(x\) і\(y\) є позитивним, що призводить до високої загальної суми для\(xy\) колонки. Нарешті, якби були негативні відносини, то позитивні значення були\(x\) б пов'язані з від'ємними значеннями,\(y\) а негативні значення були\(x\) б пов'язані з позитивними значеннями\(y\). Це призвело б до негативних значень для\(xy\).
\ (\ pageIndex {1}\): Обчислення\(r\) «>| Х | У | х | у | xy | х 2 | на 2 | |
|---|---|---|---|---|---|---|---|
| 1 | 4 | -3 | -5 | 15 | 9 | 25 | |
| 3 | 6 | -1 | -3 | 3 | 1 | 9 | |
| 5 | 10 | 1 | 1 | 1 | 1 | 1 | |
| 5 | 12 | 1 | 3 | 3 | 1 | 9 | |
| 6 | 13 | 2 | 4 | 8 | 4 | 16 | |
| Всього | 20 | 45 | 0 | 0 | 30 | 16 | 60 |
| Середнє | 4 | 9 | 0 | 0 | 6 |
Пірсона\(r\) розроблений таким чином, що кореляція між зростом і вагою однакова, незалежно від того, вимірюється висота в дюймах або в футах. Для досягнення цієї властивості кореляція Пірсона обчислюється шляхом ділення суми\(xy\) стовпця (\(\sum xy\)) на квадратний корінь добутку суми\(x^2\) стовпця (\(\sum x^2\)) і суми\(y^2\) стовпця (\(\sum y^2\)). Отримана формула:
\[r=\dfrac{\sum xy}{\sqrt{\sum x^2\sum y^2}}\]
і тому
\[r=\dfrac{30}{\sqrt{(16)(60)}}=\dfrac{30}{\sqrt{960}}=\dfrac{30}{30.984}=0.968\]
Альтернативною обчислювальною формулою, яка дозволяє уникнути кроку обчислення балів відхилення, є:
\[r=\dfrac{\sum XY-\dfrac{\sum X\sum Y}{N}}{\sqrt{\left ( \sum X^2-\dfrac{\left ( \sum X \right )^2}{N} \right )}\sqrt{\left ( \sum Y^2-\dfrac{\left ( \sum Y \right )^2}{N} \right )}}\]
