10.3: Характеристики оцінювачів
Цілі навчання
- Визначити упередженість
- Визначте варіативність вибірки
- Визначте очікуване значення
- Визначте відносну ефективність
У цьому розділі розглядаються дві важливі характеристики статистики, що використовуються в якості точкових оцінок параметрів: зміщення та варіативність вибірки. Упередженість стосується того, чи схильний оцінювач або перевищувати або занижувати параметр. Мінливість вибірки відноситься до того, наскільки оцінка варіюється від зразка до зразка.
Ви коли-небудь помічали, що деякі ваги для ванної кімнати дають вам дуже різну вагу кожного разу, коли ви зважуєте себе? З огляду на це, давайте порівняємо дві шкали. Масштаб1 - це дуже високотехнологічна цифрова шкала і дає по суті однакову вагу кожного разу, коли ви зважуєте себе; вона варіюється на максимум0.02 кілограмів від зважування до зважування. Хоча ця шкала може бути дуже точною, вона калібрована неправильно і, в середньому, завищує вашу вагу на один фунт. Ваги2 є дешевою шкалою і дають дуже різні результати від зважування до зважування. Однак це так само, як і недооцінювати, як і завищувати свою вагу. Іноді він значно переоцінює його, а іноді значно недооцінює його. Однак середнє значення великої кількості вимірювань буде вашою фактичною вагою. Шкала1 є упередженою, оскільки в середньому її вимірювання на один фунт перевищують вашу фактичну вагу. Масштаб2, навпаки, дає неупереджені оцінки вашої ваги. Однак масштаб2 дуже мінливий, і його вимірювання часто дуже далекі від вашої справжньої ваги. Масштаб1, незважаючи на упередженість, досить точний. Його вимірювання ніколи не перевищують1.02 кілограмів від вашої фактичної ваги.
Тепер перейдемо до більш формальним визначенням мінливості та точності. Однак основні ідеї такі ж, як на прикладі шкали ванної кімнати.
Упередженість
Статистика є упередженим, якщо довгострокове середнє значення статистики не є параметром, який він оцінює. Більш формально статистика є упередженою, якщо середнє значення розподілу вибірки статистики не дорівнює параметру. Середнє значення розподілу вибірки статистики іноді називають очікуваним значенням статистики.
Як ми бачили в розділі про розподіл вибірки середнього значення, середнє розподіл вибірки (вибіркового) середнього значення - це середнє значення популяції (μ). Тому вибіркове середнє значення є неупередженою оцінкоюμ. Будь-яке задане середнє значення вибірки може занижувати або завищуватиμ, але немає систематичної тенденції до того, щоб вибіркові засоби були або занижені, або завищуватиμ.
У розділі про мінливість ми побачили, що формула дисперсії в популяції
σ2=∑(X−μ)2N
тоді як формула для оцінки дисперсії від вибірки
s2=∑(X−M)2N−1
Зверніть увагу, що знаменники формул різні:N для населення іN−1 для вибірки. Ми бачили в «Оцінюванні моделювання дисперсії», що якщоN використовується у формулі дляs2, то оцінки, як правило, занадто низькі і, отже, упереджені. Формула зN−1 в знаменнику дає неупереджену оцінку дисперсії популяції. Зверніть увагу, щоN−1 це ступені свободи.
Варіабельність вибірки
Мінливість вибірки статистики стосується того, наскільки статистика змінюється від вибірки до вибірки і зазвичай вимірюється її стандартною похибкою; чим менша стандартна похибка, тим менше мінливість вибірки. Наприклад, стандартна похибка середнього - це міра мінливості вибірки середнього. Нагадаємо, що формула стандартної похибки середнього
σM=σ√N
Чим більше розмір вибірки (N), тим менша стандартна похибка середнього значення і, отже, менша варіативність вибірки.
Статистика відрізняється варіативністю вибірки навіть при однаковому розмірі вибірки. Наприклад, для нормальних розподілів стандартна похибка медіани більше стандартної похибки середнього. Чим менша стандартна похибка статистики, тим ефективніша статистика. Відносна ефективність двох статистичних даних зазвичай визначається як співвідношення їх стандартних помилок. Однак іноді його визначають як співвідношення їх квадратів стандартних похибок.