Skip to main content
LibreTexts - Ukrayinska

4.1: Характеристика вимірювань та результатів

  • Page ID
    24879
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Почнемо з вибору простої кількісної задачі, яка вимагає одного виміру: Яка маса копійки? Ви, напевно, визнаєте, що наша постановка проблеми занадто широка. Наприклад, нас цікавить маса копійки США або канадської копійки, або різниця актуальна? Оскільки склад і розмір копійки можуть відрізнятися від країни до країни, давайте звузити нашу проблему до копійок від Сполучених Штатів.

    Є й інші проблеми, які ми могли б розглянути. Наприклад, Монетний двір США виробляє копійки в двох місцях (Рисунок Template:index). Оскільки здається малоймовірним, що маса копійки залежить від того, де її карбують, ми проігноруємо це занепокоєння. Ще одне занепокоєння полягає в тому, чи відрізняється маса новоспеченої копійки від маси циркулюючої копійки. Оскільки відповідь на цей раз не очевидна, давайте ще більше звузимо наше питання і запитаємо: «Яка маса циркулюючої Сполучених Штатів Пенні?»

    Малюнок Template:index: Анциркульований 2005 Лінкольн голова пенні. «D» під датою вказує на те, що ця копійка була вироблена на монетному дворі США в Денвері, штат Колорадо. Гроші, вироблені на монетному дворі Філадельфії, не мають літери нижче дати. Джерело: Монетний двір США зображення.

    Хороший спосіб почати наш аналіз - зібрати деякі попередні дані. Таблиця Template:index показує маси за сім копійок, зібраних з моєї змінної банки. Вивчаючи ці дані, ми бачимо, що наше питання не має простої відповіді. Тобто ми не можемо використовувати масу жодної копійки, щоб зробити конкретний висновок про масу будь-якої іншої копійки (хоча ми могли б розумно зробити висновок, що всі копійки важать не менше 3 г). Однак ми можемо охарактеризувати ці дані, повідомляючи про поширення окремих вимірювань навколо центрального значення.

    Таблиця Template:index: Маси семи циркулюючих американських копійок
    Пенні Маса (г)
    1 3.080
    2 3.094
    3 3.107
    4 3.056
    5 3.112
    6 3.174
    7 3.198

    Заходи центральної тенденції

    Один із способів охарактеризувати дані в таблиці Template:index полягає в тому, щоб припустити, що маси окремих копійок розкидані випадковим чином навколо центрального значення, яке є найкращою оцінкою очікуваної копійки або «справжньої» маси. Існує два загальних способи оцінки центральної тенденції: середня і медіана.

    Середнє

    Середнє значення,\(\overline{X}\), є числовим середнім для набору даних. Обчислюємо середнє, діливши суму окремих значень на розмір набору даних

    \[\overline{X} = \frac {\sum_{i = 1}^n X_i} {n} \nonumber\]

    де\(X_i\) - i вимір, а n - розмір набору даних.

    Приклад Template:index

    Що означає для даних у таблиці Template:index?

    Рішення

    Для обчислення середнього складаємо разом результати за всіма вимірами.

    \[3.080 + 3.094 + 3.107 + 3.056 + 3.112 + 3.174 + 3.198 = 21.821 \text{ g} \nonumber\]

    і ділимо на кількість вимірювань

    \[\overline{X} = \frac {21.821 \text{ g}} {7} = 3.117 \text{ g} \nonumber\]

    Середнє значення є найбільш поширеною оцінкою центральної тенденції. Однак це не надійна оцінка, оскільки одне екстремальне значення - набагато більше або набагато менше, ніж решта даних - сильно впливає на середнє значення [Rousseeuw, P JJ Chemom. 1991, 5, 1—20]. Наприклад, якщо випадково зафіксувати масу третьої копійки як 31,07 г замість 3,177 г, середнє значення змінюється з 3,117 г до 7,112 г!

    Оцінка статистичного параметра є надійною, якщо на його значення не надто впливає незвично велике або незвично мале вимірювання.

    Медіана

    Медіана - це середнє значення \(\widetilde{X}\), коли ми впорядковуємо наші дані від найменшого до найбільшого значення. Коли дані мають непарну кількість значень, медіана - це середнє значення. Для парного числа значень медіана - це середнє значення n /2 і (n /2) + 1 значень, де n - розмір набору даних.

    При n = 5 медіана - це третє значення в упорядкованому наборі даних; для n = 6 медіана - середнє значення третього і четвертого членів впорядкованого набору даних.

    Приклад Template:index

    Яка медіана для даних у таблиці Template:index?

    Рішення

    Для визначення медіани замовляємо вимірювання від найменшого до найбільшого значення.

    \(3.056 \quad 3.080 \quad 3.094 \quad 3.107 \quad 3.112 \quad 3.174 \quad 3.198\)

    Оскільки існує сім вимірювань, медіана є четвертим значенням в упорядкованих даних; таким чином, медіана становить 3,177 г.

    Як показано на прикладі Template:index та прикладі Template:index, середнє і медіана дають однакові оцінки центральної тенденції, коли всі вимірювання є порівнянними за величиною. Медіана, однак, є більш надійною оцінкою центральної тенденції, оскільки вона менш чутлива до вимірювань з екстремальними значеннями. Наприклад, якщо випадково записати масу третьої копійки як 31,07 г замість 3,177 г, значення медіани змінюється з 3,1107 г до 3,112 г.

    Заходи поширення

    Якщо середнє або медіана дає оцінку очікуваної маси копійки, то розкид окремих вимірювань про середнє або медіану дає оцінку різниці маси серед копійок або невизначеності в вимірюванні маси з балансом. Хоча ми часто визначаємо розкид щодо певної міри центральної тенденції, його величина не залежить від центрального значення. Хоча зміщення всіх вимірювань в одному напрямку шляхом додавання або віднімання постійної величини змінює середнє або медіану, це не змінює розкид. Існує три загальні заходи поширення: діапазон, стандартне відхилення та дисперсія.

    Завдання 13 в кінці глави просить вас показати, що це правда.

    Діапазон

    Діапазон w - це різниця між найбільшим і найменшим значеннями набору даних.

    \[w = X_\text{largest} - X_\text{smallest} \nonumber\]

    Діапазон надає інформацію про сумарну мінливість в наборі даних, але не дає інформації про розподіл окремих значень. Діапазон даних у таблиці Template:index

    \[w = 3.198 \text{ g} - 3.056 \text{ g} = 0.142 \text{ g} \nonumber\]

    Стандартне відхилення

    Стандартне відхилення, s, описує розкид окремих значень про їх середнє, і дається як

    \[s = \sqrt{\frac {\sum_{i = 1}^{n} (X_i - \overline{X})^{2}} {n - 1}} \label{4.1}\]

    де\(X_i\) - одне з n індивідуальних значень у наборі даних, і\(\overline{X}\) середнє значення набору даних. Часто ми повідомляємо відносне стандартне відхилення, s r, замість абсолютного стандартного відхилення.

    \[s_r = \frac {s} {\overline{X}} \nonumber\]

    Відсоток відносного стандартного відхилення,% s r, дорівнює\(s_r \times 100\).

    Відносне стандартне відхилення важливо, оскільки дозволяє більш значуще порівняння між наборами даних, коли окремі вимірювання значно відрізняються за величиною. Розглянемо ще раз дані в таблиці Template:index. Якщо помножити кожне значення на 10, абсолютне стандартне відхилення також збільшиться на 10; однак відносне стандартне відхилення однакове.

    Приклад Template:index

    Повідомити про стандартне відхилення, відносне стандартне відхилення та відносне стандартне відхилення відсотків для даних у таблиці Template:index?

    Рішення

    Для обчислення стандартного відхилення спочатку обчислимо різницю між кожним виміром та середнім значенням набору даних (3.117), квадратизуємо отримані відмінності та складаємо їх разом, щоб знайти чисельник Equation\ ref {4.1}

    \ [\ почати {вирівнювати*}
    (3.080-3.117) ^2 = (-0.037) ^2 = 0,001369\\
    (3.094-3.117) ^2 = (-0.023) ^2 = 0,000529\\
    (3.107-3.117) ^2 = (-0.010) ^2 = 0,000100\\
    (3.056-3.117) ^2 = (-0.061) ^2 = 0,003721\\
    (3,112-3.117) ^2 = (-0,005) ^2 = 0,000025\
    (3.174-3.117) ^2 = (+0.057) ^2 = 0,003249\\
    (3.198-3.117) ^2 = (+0.081) ^2 =\ підкреслення {0,006561}\\
    0,015554
    \ кінець {вирівнювати*}\]

    Зі зрозумілих причин чисельник Equation\ ref {4.1} називається сумою квадратів. Далі ділимо цю суму квадратів на n — 1, де n - кількість вимірювань, і беремо квадратний корінь.

    \[s = \sqrt{\frac {0.015554} {7 - 1}} = 0.051 \text{ g} \nonumber\]

    Нарешті, відносне стандартне відхилення та відсоток відносного стандартного відхилення

    \[s_r = \frac {0.051 \text{ g}} {3.117 \text{ g}} = 0.016 \nonumber\]

    \[\% s_r = (0.016) \times 100 = 1.6 \% \nonumber\]

    Значно простіше визначити стандартне відхилення за допомогою наукового калькулятора з вбудованими статистичними функціями.

    Багато наукових калькуляторів включають два ключа для розрахунку стандартного відхилення. Один ключ обчислює стандартне відхилення для набору даних з n зразків, взятих з більшої колекції можливих зразків, що відповідає Equation\ ref {4.1}. Інший ключ обчислює стандартне відхилення для всіх можливих зразків. Останнє відоме як стандартне відхилення населення, про яке ми розповімо далі в цьому розділі. Посібник вашого калькулятора допоможе вам визначити відповідний ключ для кожного.

    дисперсія

    Ще однією поширеною мірою поширення є дисперсія, яка є квадратом стандартного відхилення. Зазвичай ми повідомляємо про стандартне відхилення набору даних, а не його дисперсію, оскільки середнє значення та стандартне відхилення мають однакову одиницю. Як ми побачимо незабаром, дисперсія є корисною мірою поширення, оскільки її значення є адитивними.

    Приклад Template:index

    Яка дисперсія для даних у таблиці Template:index?

    Рішення

    Дисперсія - квадрат абсолютного стандартного відхилення. Використання стандартного відхилення від Example Template:index дає дисперсію як

    \[s^2 = (0.051)^2 = 0.0026 \nonumber\]

    Вправа Template:index

    Наступні дані були зібрані в рамках дослідження контролю якості для аналізу натрію в сироватці крові; результати - концентрації Na + в ммоль/л.

    \(140 \quad 143 \quad 141 \quad 137 \quad 132 \quad 157 \quad 143 \quad 149 \quad 118 \quad 145\)

    Повідомте середнє значення, медіану, діапазон, стандартне відхилення та дисперсію для цих даних. Ці дані є частиною більшого набору даних від Ендрю, D.F.; Herzberg, A.M. Дані: Збірник проблем для студента та наукового працівника, Springer-Verlag: Нью-Йорк, 1985, стор. 151—155.

    Відповідь

    Середнє: Щоб знайти середнє, складаємо разом окремі виміри і ділимо на кількість вимірювань. Сума 10 концентрацій становить 1405. Діливши суму на 10, дає середнє значення як 140,5, або\(1.40 \times 10^2\) ммоль/л.

    Медіана: Щоб знайти медіану, ми організуємо 10 вимірювань від найменшої концентрації до найбільшої концентрації; таким чином

    \(118 \quad 132 \quad 137 \quad 140 \quad 141 \quad 143 \quad 143 \quad 145 \quad 149 \quad 157\)

    Медіана для набору даних з 10 членами - це середнє значення п'ятого та шостого значень; таким чином, медіана становить (141 + 143) /2, або 142 ммоль/л.

    Діапазон: Діапазон - це різниця між найбільшим значенням та найменшим значенням; таким чином, діапазон становить 157 - 118 = 39 ммоль/л.

    Стандартне відхилення: Щоб обчислити стандартне відхилення, ми спочатку обчислюємо абсолютну різницю між кожним вимірюванням та середнім значенням (140,5), квадратуємо отримані відмінності та складаємо їх разом. Відмінності полягають у

    \(–0.5 \quad 2.5 \quad 0.5 \quad –3.5 \quad –8.5 \quad 16.5 \quad 2.5 \quad 8.5 \quad –22.5 \quad 4.5\)

    і квадратні відмінності

    \(0.25 \quad 6.25 \quad 0.25 \quad 12.25 \quad 72.25 \quad 272.25 \quad 6.25 \quad 72.25 \quad 506.25 \quad 20.25\)

    Загальна сума квадратів, що є чисельником Рівняння\ ref {4.1}, становить 968,50. Стандартне відхилення

    \[s = \sqrt{\frac {968.50} {10 - 1}} = 10.37 \approx 10.4 \nonumber\]

    Дисперсія: дисперсія - квадрат стандартного відхилення, або 108.