6.4: Зсув вибірки
Цілі навчання
- Розпізнати ухил вибір
- Розрізняють упередженість самостійного вибору, упередженість недостатнього покриття та упередженість виживання
Описи різних типів вибірки, таких як проста випадкова вибірка та стратифікована випадкова вибірка, розглядаються в іншому розділі. У цьому розділі розглядаються різні типи упереджень вибірки, включаючи упередження самовибору та упередженість у виживанні. Також будуть наведені приклади інших упереджень вибірки, які не легко класифікуються.
Важливо мати на увазі, що зміщення відбору проб відноситься до методу відбору проб, а не самого зразка. Немає ніякої гарантії, що випадкова вибірка призведе до вибірки репрезентативної популяції так само, як не кожна вибірка, отримана за допомогою методу упередженого вибірки, буде значно нерепрезентативною для популяції.
Ухил самостійного вибору
Уявіть, що університетська газета запустила оголошення з проханням студентів добровільно провести дослідження, в якому обговорюватимуться інтимні подробиці їхнього сексуального життя. Зрозуміло, що вибірка студентів, які будуть добровольцями для такого дослідження, не буде репрезентативною для студентів в університеті. Аналогічним чином, онлайн-опитування щодо використання комп'ютера, ймовірно, приверне людей, більше зацікавлених у технології, ніж це типово. В обох цих прикладах люди, які «самостійно відбирають» себе для експерименту, швидше за все, будуть відрізнятися важливими способами від населення, про яке бажає зробити висновки експериментатор. Багато хто з, за загальним визнанням, «ненаукових» опитувань, проведених на телебаченні чи веб-сайтах, сильно страждають від упередженості самовибору.
Зміщення самовибору може призвести, коли невипадковий компонент виникає після того, як потенційний суб'єкт зараховується до експерименту. Враховуючи ще раз гіпотетичний експеримент, в якому суб'єкти повинні запитати інтимні подробиці їх статевого життя, припустимо, що суб'єкти не знали, про що буде експеримент, поки вони не з'являться.Багато випробуваних потім, ймовірно, залишать експеримент, що призведе до упередженої вибірки.
Недокриття упередженості
Поширеним типом зміщення вибірки є вибірка занадто мало спостережень з сегмента населення. Звичайним прикладом недовисвітлення є опитування, проведене Літературним дайджестом1936, яке вказувало на те, що Лендон виграє вибори проти Рузвельта з великим відривом, коли насправді це був Рузвельт, який виграв з великим відривом. Поширене пояснення полягає в тому, що бідніші люди були приховані, оскільки вони рідше мали телефони, і що ця група з більшою ймовірністю підтримувала Рузвельта.
Детальний аналіз Squire (1988) показав, що не просто упереджене покриття призвело до помилкового прогнозування результатів виборів. Він дійшов висновку, що, на додаток до описаного вище заниження, існувало упереджене відхилення відповіді (форма упередженості самовідбору) таким чином, що ті, хто виступає за Лендон, частіше повертають своє опитування, ніж ті, хто прихильний Рузвельту.
Упередженість у виживанні
Упередженість у виживанні виникає, коли спостереження, записані в кінці розслідування, є невипадковим набором тих, хто присутній на початку розслідування. Прибуток фондових фондів - це область, в якій часто відіграє певну роль упередженість у виживанні. Основна проблема полягає в тому, що погано працюють кошти часто або усуваються, або зливаються в інші фонди. Припустимо, один розглядає вибірку фондових фондів, які існують в даний час, а потім обчислює10 середньорічну оцінку цих фондів. Чи можуть ці результати бути достовірно узагальнені для інших фондових фондів того ж типу? Проблема полягає в тому, що неефективні фондові фонди, які ще не існують (не виживали10 роками), не включаються, і тому існує упередження до вибору більш ефективних фондів. Є хороші докази того, що це упередження виживання є суттєвим (Malkiel,1995).
У Другій світовій війні статистик Абрахам Вальд проаналізував розподіл ударів від зенітного вогню по літакам, що повертаються з місій. Ідея полягала в тому, що ця інформація буде корисною для вирішення питання, де розмістити додаткову броню. Наївним підходом було б покласти броню в місцях, які часто потрапляли, щоб зменшити шкоду там. Однак це ігнорувало б упередження виживання, що відбувається, оскільки повертається лише підмножина літаків. Підхід Вальда був протилежним: якщо на літаках, що повертаються, було мало ударів у певному місці, то хіти в цьому місці, швидше за все, збили літак. Тому він рекомендував, щоб локації без попадань на літаки, що повертаються, надавали додаткову броню. Детальний і математичний опис творчості Вальда можна знайти в Мангеле і Саманіего (1984.)
Посилання
- Malkiel, BG (1995) Повернення від інвестування в пайові інвестиційні фонди 1971 по 1991 рік. Журнал фінансів, 50, 549-572.
- Мангель, М. & Samaniego, Ф.Дж. (1984) Робота Авраама Вальда з живучості літаків. Журнал Американської статистичної асоціації, 79, 259-267.
- Сквайр, П. (1988) Чому опитування літературного дайджесту 1936 року не вдалося. Громадська думка щоквартально, 52, 125-133.