6.2: Інтервали довіри
У попередньому розділі ми навчилися прогнозувати ймовірність отримання того чи іншого результату, якщо наші дані нормально розподіляються з відомимμ і відомимσ. Наприклад, ми підрахували, що 11,60% зразків, взятих випадковим чином із стандартного еталонного матеріалу, матимуть концентрацію Pb більше 5,650 ppb, враховуючи 5,5833 ppb та aσ 0,0558 ppb.μ По суті, ми визначили, від якої кількості стандартних відхилень становить 5,650,μ і використали це для визначення ймовірності заданої стандартної площі при нормальній кривій розподілу.
Ми можемо поглянути на це по-іншому, задаючи наступне питання: Якщо ми збираємо одну вибірку навмання з популяції з відомимμ і відомимσ, в якому діапазоні значень ми можемо обґрунтовано очікувати, щоб знайти результат вибірки 95% часу? Перестановка рівняння
z=x−μσ
і рішення дляx дарує
x=μ±zσ=5.5833±(1.96)(0.0558)=5.5833±0.1094
де az 1,96 відповідає 95% площі під кривою; ми називаємо це 95% довірчим інтервалом для однієї вибірки.
Як правило, погано робити висновок з результату одного експерименту; натомість ми зазвичай збираємо кілька зразків і задаємо питання таким чином: якщо ми збираємоn випадкові зразки з популяції з відомимμ і відомимσ, в якому діапазоні значень ми могли б розумно розраховувати знайти середнє значення цих зразків 95% часу?
Ми можемо обґрунтовано очікувати, що стандартне відхилення для середнього значення декількох зразків менше, ніж стандартне відхилення для набору окремих зразків; насправді це так, і воно дається як
σˉx=σ√n
деσ√n називається стандартною похибкою середнього. Наприклад, якщо ми збираємо три зразки зі стандартного еталонного матеріалу, описаного вище, то ми очікуємо, що середнє значення для цих трьох зразків буде потрапляти в діапазон.
ˉx=μ±zσˉX=μ±zσ√n=5.5833±(1.96)(0.0558)√3=5.5833±0.0631
тобто±0.0631 ppb навколоμ, діапазон, який менший, ніж у±0.1094 ppb, коли ми аналізуємо окремі зразки. Зверніть увагу, що відносне значення для нас збільшення розміру вибірки зменшується зіn збільшенням через квадратний корінь, як показано на малюнку6.2.1.

Наше лікування досі передбачає, що ми знаємоμ іσ для материнського населення, але ми рідко знаємо ці значення; натомість ми вивчаємо зразки, взяті з батьківської популяції,ˉx і задаємо наступне питання: Враховуючи середнє значення вибірки та її стандартне відхиленняs, що таке наше найкраща оцінка середнього чисельності населенняμ, і його стандартного відхилення,σ.
Щоб зробити цю оцінку, ми замінюємо стандартне відхилення населенняσ, на стандартне відхиленняs, для наших зразків, замінюємо середнє значення популяціїμ, на середнєˉx, для наших зразківt,z замінюємо на, де значенняt залежить від кількість зразків,n
ˉx=μ±ts√n
а потім переставити рівняння для вирішенняμ.
μ=ˉx±ts√n
Ми називаємо це довірчим інтервалом. Значення дляt доступні в таблицях (див. Додаток 2) і залежать від рівня ймовірностіα, де(1−α)×100 рівень довіри, і ступеня свободиn−1; зверніть увагу, що для будь-якого рівня ймовірності,t⟶z якn⟶∞.
Потрібно приділити особливу увагу тому, що означає цей довірчий інтервал і що він не означає:
- Це не означає, що існує 95% ймовірність того, що середнє значення населення знаходиться в діапазоні,μ=ˉx±ts оскільки наші вимірювання можуть бути упередженими або нормальний розподіл може бути неприйнятним для нашої системи.
- Це забезпечує нашу найкращу оцінку середнього рівня популяції,μ враховуючи наш аналізn зразків, взятих випадковим чином з материнської популяції; однак інша вибірка дасть інший довірчий інтервал і, отже, іншу оцінку дляμ.