Loading [MathJax]/jax/output/HTML-CSS/jax.js
Skip to main content
LibreTexts - Ukrayinska

3.4: Обмеження довіри

Цілі навчання
  • Межі довіри говорять вам, наскільки точною буде ваша оцінка середнього значення.

Вступ

Після того, як ви розрахували середнє значення набору спостережень, вам слід вказати, наскільки близькою буде ваша оцінка до параметричного («істинного») середнього. Один із способів зробити це - з обмеженнями впевненості. Межі довіри - це числа у верхньому та нижньому кінці довірчого інтервалу; наприклад, якщо ваше середнє значення7.4 з обмеженнями довіри5.4 і9.4, ваш довірчий інтервал5.4 повинен9.4. Більшість людей використовують обмеження95% довіри, хоча ви можете використовувати інші значення. Встановлення95% довірчих обмежень означає, що якщо ви взяли повторювані випадкові вибірки з популяції та обчислили середні та довірчі межі для кожної вибірки, довірчий інтервал для95% ваших зразків буде включати параметричне середнє значення.

Щоб проілюструвати це, наведемо засоби та довірчі інтервали для100 зразків3 спостережень з популяції з параметричним середнім значенням5. З100 зразків94 (показані зX для середнього та тонкої лінії для довірчого інтервалу) мають параметричне середнє в межах свого95% довірчого інтервалу, а6 (показано колами та товстими лініями) мають параметричне середнє за межами довірчого інтервалу.

Мал. 3.4.1 Середні та довірчі інтервали для 100 зразків 3 спостережень

При більших розмірах вибірки95% довірчі інтервали стають меншими:

Мал. 3.4.2 Середні та довірчі інтервали для 100 зразків із 20 спостережень

Коли ви обчислюєте довірчий інтервал для однієї вибірки, спокусливо сказати, що «існує95% ймовірність того, що довірчий інтервал включає параметричне середнє». Це технічно невірно, оскільки це означає, що якщо ви збирали зразки з однаковим довірчим інтервалом, іноді вони включали б параметричне середнє значення, а іноді - ні. Наприклад, перший зразок на малюнку вище має довірчі межі4.59 і5.51. Було б невірно сказати, що того95% часу параметричне середнє значення для цієї популяції лежало б між4.59 і5.51. Якби ви взяли повторні зразки з цієї ж популяції і неодноразово отримували довірчі межі4.59 і5.51, параметричне середнє (тобто5, пам'ятайте) було б в цьому інтервалі100% часу. Деякі статистики не дбають про цю заплутану, педантичну відмінність, але інші дуже прискіпливі до цього, тому добре знати.

Межі довіри для змінних вимірювань

Щоб обчислити довірчі межі для змінної вимірювання, помножте стандартну похибку середнього часу відповідного t-значення. tЗначення -визначається ймовірністю (0.05для95% довірчого інтервалу) і ступенями свободи (n1). У електронній таблиці ви можете використовувати =( STDEV (Ys) /SQRT (COUNT (Ys))) * TINV (0.05, COUNT (Ys) -1), деYs діапазон комірок, що містять ваші дані. Ви додаєте це значення і віднімаєте його із середнього значення, щоб отримати межі довіри. Таким чином, якщо середнє значення87 іt -значення разів стандартна помилка10.3, обмеження довіри будуть76.7 і97.3. Ви також можете повідомити про це як "87±10.3(обмеження95% довіри).» Люди повідомляють як обмеження довіри, так і стандартні помилки як «±щось означають», тому завжди обов'язково вказуйте, про що ви говорите.

Все вищесказане відноситься тільки до нормально розподілених змінних вимірювань. Для даних вимірювань з дуже ненормального розподілу, методи початкового завантаження, про які я не буду говорити тут, можуть дати кращі оцінки меж довіри.

Довірчі межі для номінальних змінних

Існує інша, більш складна формула, заснована на біноміальному розподілі, для обчислення довірчих меж пропорцій (номінальні дані). Важливо, що це дає межі довіри, які не симетричні навколо пропорції, особливо для пропорцій, близьких до нуля або одиниці. John Pezzullo має простий у використанні веб-сторінку для довірчих інтервалів пропорції. Щоб побачити, як це працює, скажімо, ви взяли зразок20 чоловіків і знайшли2 дальтонік і18 не дальтонік. Перейдіть на веб-сторінку та введіть2 у поле «Чисельник» та20 поле «Знаменник», а потім натисніть «Обчислити». Результати для цього прикладу будуть нижньою межею довіри0.0124 та верхньою межею довіри0.3170. Ви не можете повідомити про частку кольорових сліпих чоловіків як "0.10±something, натомість вам доведеться сказати"0.10 з95% упевненістю0.0124 обмеженнями і»0.3170.

Альтернативна методика оцінки довірчих меж пропорції передбачає, що пропорції зразка зазвичай розподілені. Ця приблизна методика дає симетричні межі довіри, які для пропорцій поблизу нуля або одиниці очевидно невірні. Наприклад, якщо ви обчислите межі довіри, використовуючи нормальне наближення0.10 з розміром вибірки20, ви отримаєте0.03 і0.23, що смішно (ви не могли б мати менше, ніж0% чоловіки, які є дальтоніками). Також було б невірно сказати, що обмеження довіри були0 і0.23, тому що ви знаєте, що частка дальтоніків у вашому населенні більша, ніж0 (у вашому зразку було два дальтоніків, тож ви знаєте, що населення має щонайменше двох дальтоніків). Я вважаю, що обмеження довіри для пропорцій, заснованих на нормальному наближенні, застарілими для більшості цілей; слід використовувати довірчий інтервал, заснований на біноміальному розподілі, якщо розмір вибірки не настільки великий, що обчислювально-непрактичний. На жаль, більше людей використовують межі довіри, засновані на нормальному наближенні, ніж використовують правильні, біноміальні межі довіри.

Формула95% довірчого інтервалу з використанням нормального наближення -p цеp±1.96[p(1p)n], деn пропорція і розмір вибірки. Таким чином, дляP=0.20 іn=100, довірчий інтервал буде±1.96[0.20(10.20)100], або0.20±0.078. Загальне правило говорить, що це нормально використовувати це наближення до тих пір, поки більше, ніж5; моє правилоnpq полягає в тому, щоб використовувати нормальне наближення тільки тоді, коли розмір вибірки настільки великий, що обчислення точного біноміального довірчого інтервалу змушує дим виходити з вашого комп'ютера.

Статистичне тестування з довірчими інтервалами

Цей довідник здебільшого представляє «класичну» або «частотну» статистику, в якій гіпотези перевіряються шляхом оцінки ймовірності отримання спостережуваних результатів випадково, якщо нуль істинно (Pзначення). Альтернативний спосіб ведення статистики полягає в тому, щоб поставити довірчий інтервал на міру відхилення від нульової гіпотези. Наприклад, замість того, щоб порівнювати два засоби з двовибірковим t-тестом, деякі статистики обчислили б довірчий інтервал різниці в середніх.

Цей підхід є цінним, якщо невелике відхилення від нульової гіпотези буде нецікавим, коли вас більше цікавить розмір ефекту, а не те, чи він існує. Наприклад, якщо ви робите остаточне тестування нового препарату, який ви впевнені, матиме певний ефект, ви будете в основному зацікавлені в оцінці того, наскільки добре він працював, і наскільки ви впевнені в розмірі цього ефекту. Ви хочете, щоб ваш результат був «Цей препарат знижував систолічний артеріальний тиск10.7mmHg, з довірчим інтервалом7.8 до»13.6, а не «Цей препарат значно знизив систолічний артеріальний тиск (P=0.0007)».

Використання обмежень довіри таким чином, як альтернатива статистиці частот, має багато прихильників, і це може бути корисним підходом. Однак я часто бачу людей, які говорять такі речі, як «Різниця в середньому артеріальному тиску була10.7mmHg, з довірчим інтервалом7.8 до13.6; тому що довірчий інтервал на різницю не включає0, засоби значно відрізняються». Це просто незграбний, обхідний спосіб проведення тестування гіпотез, і вони повинні просто визнати це і зробити частотний статистичний тест.

Існує міф, що коли два засоби мають довірчі інтервали, які перекриваються, кошти істотно не відрізняються (наP<0.05 рівні). Інша версія цього міфу полягає в тому, що якщо кожне середнє значення знаходиться поза довірчим інтервалом іншого засобу, засоби значно відрізняються. Жоден з них не відповідає дійсності (Schenker and Gentleman 2001, Payton et al. 2003); два набори чисел легко мати перекриваються довірчі інтервали, але все ще значно відрізнятися за допомогою двовибіркового t -тесту; навпаки, кожне середнє значення може бути поза довірчим інтервалом іншого, але вони є все ще істотно не відрізняється. Не намагайтеся порівнювати два засоби, візуально порівнюючи їх довірчі інтервали, просто використовуйте правильний статистичний тест.

Подібна статистика

Межі довіри і стандартна похибка середнього служать одній і тій же меті, щоб висловити достовірність оцінки середнього. Коли ви дивитеся на наукові праці, іноді «смуги помилок» на графіках або ± число після засобів у таблицях представляють стандартну похибку середнього, тоді як в інших роботах вони представляють95% довірчі інтервали. Я віддаю перевагу95% інтервалам довіри. Коли я бачу графік з купою точок і смуг помилок, що представляють засоби та довірчі інтервали, я знаю, що більшість (95%) смуг помилок включають параметричні засоби. Коли смуги помилок є стандартними похибками середнього, лише близько двох третин барів, як очікується, включають параметричні засоби; Я повинен подумки подвоїти стовпчики, щоб отримати приблизний розмір95% довірчого інтервалу (тому щоt(0.05) приблизно2 для всіх, але дуже малих значень зn). Яку б статистику ви не вирішили використовувати, обов'язково дайте зрозуміти, що представляють смуги помилок на ваших графіках. Дивовижна кількість статей не говорить, що представляють їх смуги помилок, а це означає, що єдина інформація, яку смуги помилок передають читачеві, - це те, що автори недбалі та недбалі.

Приклади

Дані вимірювань

Дані чорнозового танцю з центральної веб-сторінки тенденції мають середнє арифметичне значення70.0. Нижня межа довіри -45.3 (70.024.7), а верхня межа довіри -94.7 (70+24.7).

Номінальні дані

Якщо ви працюєте з великою кількістю пропорцій, добре мати приблизне уявлення про обмеження довіри для різних розмірів вибірки, тому ви маєте уявлення про те, скільки даних вам знадобиться для конкретного порівняння. Для пропорцій поруч50% довірчі інтервали приблизно±30%,10%,3%, а1% дляn=10,100,1000, і10,000 відповідно. Ось чому «похибка» в політичних опитуваннях, які зазвичай мають розмір вибірки навколо1,000, зазвичай приблизно3%. Звичайно, ця груба ідея не замінює фактичного аналізу потужності.

п пропорція = 0,10 пропорція = 0,50
10 0.0025, 0.4450 0.1871, 0.8129
100 0.0490, 0,1762 0.3983, 0.6017
1000 0.0821, 0.1203 0.4685, 0.5315
10 000 0.0942, 0.1060 0.4902, 0.5098

Як розрахувати довірчі межі

Електронні таблиці

Таблиця описової статистики descriptive.xls обчислює межі95% довіри середнього для1000 вимірювань. Довірчі інтервали для електронної таблиці біноміальної пропорції confidence.xls обчислює95% довірчі межі для номінальних змінних, використовуючи як точне біноміальне, так і нормальне наближення.

Веб-сторінки

Ця веб-сторінка обчислює довірчі інтервали середнього значення для спостережень до10,000 вимірювань. Веб-сторінка для довірчих інтервалів пропорції обробляє номінальні змінні.

Р

RКомпаньйон Сальваторе Мангіафіко має вибіркові програми R для довірчих обмежень як для вимірювання, так і для номінальних змінних.

САС

Щоб отримати довірчі межі для змінної вимірювання, додайте CIBASIC до оператора PROC UNIVARIATE, ось так:

дані риби; місце
введення $ dacenumber;
карти;
Mill_Creek_1 76
Mill_Creek_2 102
Північ_Філія_Рок_Крик_1 12
Північ_Філія_Рок_Крік_1 12 Північ_Філія_Рок_Крик_2 39
Рок_Крик_1 55
Rock_Creek_2 93
Rock_Creek_3 98
Rock_Creek_4 53
Туреччина_Відділення 102
;
процес одноваріантні дані = риба цибасик;
бігти;

Вихідні дані будуть включати95% довірчі межі для середнього (а також для стандартного відхилення та дисперсії, які вам навряд чи коли-небудь знадобляться):

Основні межі довіри Припускаючи нормальність

Параметр Оцінка 95% Межі довіри

Середнє 70.00000 45.33665
94.66335 Стандартне відхилення 32.08582 21.67259 61.46908
дисперсія 1030 469.70135 3778

Це показує, що дані чорнозового танцю мають середнє значення70, з упевненістю межі45.3 і94.7.

Ви можете отримати обмеження довіри для біноміальної пропорції за допомогою PROC FREQ. Ось приклад програми з точного тесту на сторінці goodness-of-fit:

дані gus;
вхід лапи $;
карти;

правий лівий правий правий правий
правий

правий
правий
правий
правий
правий
правий
;
proc freq data=gus;
таблиці лапа/біноміальні (P = 0.5);
точний біноміальний;
прогін;

І ось частина виходу:

Біноміальна пропорція
для лапи = ліворуч
-
Пропорція 0.2000
ASE 0.1265
95% Нижня межа Conf 0,0000
95% Верхня межа Конф 0.4479

Точні межі Конф
95% Нижня межа Конф 0,0252
95% Верхня межа Конф 0.5561

Перша пара показаних довірчих меж заснована на нормальному наближенні; друга пара краща, заснована на точному біноміальному обчисленні. Зверніть увагу, що якщо у вас більше двох значень номінальної змінної, довірчі межі будуть розраховані тільки для значення, ім'я якого спочатку в алфавітному порядку. Наприклад, якщо набір даних Gus включав значення «ліворуч», «праворуч» та «обидва», SAS обчислить лише обмеження довіри щодо частки «обох». Одним з незграбних способів вирішити цю проблему було б запустити програму три рази, змінивши назву «ліворуч» на «лівий», а потім змінивши назву «праворуч» на «праворуч», щоб зробити кожну з них першим за один прогін.

Посилання

  1. Пейтон, М.Е., Грінстоун М.Х., і Н.Шенкер. 2003. Перекриття довірчих інтервалів або стандартних інтервалів помилок: що вони означають з точки зору статистичної значущості? Журнал науки про комах 3:34.
  2. Шенкер, Н., і Дж.Ф. Джентльмен. 2001 рік. Про судження значущості відмінностей шляхом вивчення перекриття між довірчими інтервалами. Американський статистик 55:182-186.