1.2: Випадкова вибірка
- Page ID
- 65973
Тепер, коли ви знаєте, що вам потрібно взяти зразки, щоб зібрати дані, наступне питання полягає в тому, як краще зібрати зразок? Існує безліч способів відбору проб. Не всі з них призведуть до репрезентативної вибірки. Крім того, тільки тому, що зразок великий, не означає, що це хороший зразок. Як приклад, ви можете взяти зразок за участю мільйона людей, щоб з'ясувати, чи вважають вони, що має бути більше контролю над зброєю, але якщо ви попросите членів Національної стрілецької асоціації (NRA) або Коаліції, щоб зупинити зброю насильства, то ви можете отримати упереджені результати. Потрібно переконатися, що ви задаєте поперечний переріз осіб. Давайте розглянемо види проб, які можна взяти. Зрозумійте, що жодна вибірка не є ідеальною, і може не призвести до представлення населення.
Перепис: Спроба зібрати вимірювання або спостереження з усіх об'єктів у всій популяції.
Справжній перепис дуже важко зробити в багатьох випадках. Однак для певних груп населення, як чиста вартість членів Сенату США, провести перепис може бути відносно легко. Ми повинні бути в змозі з'ясувати чисту вартість кожного члена Сенату, оскільки є лише 100 членів. Але, коли наш уряд намагається проводити національний перепис кожні 10 років, можна повірити, що зібрати дані про кожного американця неможливо.
Кращий спосіб знайти зразок, який є репрезентативним для популяції, - це використання випадкової вибірки. Існує кілька різних типів випадкової вибірки. Хоча це залежить від поставленого завдання, найкращим методом часто є проста випадкова вибірка, яка відбувається, коли ви випадковим чином вибираєте підмножину з усього населення.
Простий випадковий зразок: Кожна вибірка розміром n має однакові шанси бути обраними, і кожна людина в популяції має однакові шанси бути у вибірці.
Приклад простого випадкового зразка полягає в тому, щоб помістити всі імена учнів вашого класу в капелюх, а потім випадковим чином вибрати п'ять імен з капелюха.
Стратифікована вибірка: Це метод вибірки, який ділить популяцію на різні групи, звані стратами, а потім бере випадкові зразки всередині кожного пласта.
Прикладом, де стратифікована вибірка є доречною, якщо університет хоче дізнатися, скільки часу їх студенти проводять на навчання щотижня; але вони також хочуть знати, чи різні спеціальності витрачають більше часу на навчання, ніж інші. Вони могли б розділити студентське тіло на різні спеціальності (верстви), а потім випадковим чином вибрати кількість людей у кожній спеціальності, щоб запитати їх, скільки часу вони проводять на навчання. Кількість людей, запитуваних у кожній мажорній (стратах), не обов'язково повинна бути однаковою.
Систематична вибірка: Цей метод полягає в тому, що ви вибираєте кожну kth індивіда, де k - це якесь ціле число. Це використовується часто при контролі якості на складальних лініях.
Наприклад, виробник автомобілів повинен переконатися, що автомобілі, що сходять з конвеєра, не мають дефектів. Вони не хочуть тестувати кожен автомобіль, тому тестують кожен 100-й автомобіль. Таким чином вони можуть періодично бачити, чи є проблема в процесі виготовлення. Це полегшує метод відстеження тестування і все ще є випадковою вибіркою.
Кластерна вибірка: Цей метод схожий на стратифікований вибірку, але замість того, щоб розділити особин на шари, а потім випадковим чином підбирати осіб з кожного прошарку, кластерний зразок розділяє осіб на групи, випадковим чином вибирає, які групи вони будуть використовувати, а потім проводить перепис кожна людина в обраних групах.
Кластерний відбір проб дуже корисний у географічних дослідженнях, таких як думки людей у державі або вимірювання діаметра на висоті грудей дерев у національному лісі. В обох ситуаціях кластерна вибірка зменшує відстані, що проходять у простій випадковій вибірці. Наприклад, припустимо, що опитування Gallup має провести опитування громадської думки всіх зареєстрованих виборців у Колорадо. Для того, щоб вибрати хороший зразок за допомогою простої випадкової вибірки, опитування Gallup повинен мати всі імена всіх зареєстрованих виборців у Колорадо, а потім випадковим чином вибрати підмножину цих імен. Це може бути дуже складно зробити. Таким чином, вони будуть використовувати кластерний зразок замість цього. Почніть з поділу штату Колорадо на категорії або групи географічно. Випадковим чином виберіть деякі з цих груп. Тепер запитайте всіх зареєстрованих виборців в кожній з обраних груп. Це робить роботу опитувальників набагато простіше, тому що їм не доведеться подорожувати по кожному сантиметру штату, щоб отримати їх зразок, але це все ще випадковий зразок.
Вибірка квот: Це коли дослідники навмисно намагаються сформувати хорошу вибірку, створюючи перетин досліджуваної популяції.
Для прикладу припустимо, що досліджуване населення - це політична приналежність всіх жителів невеликого міста. Тепер припустимо, що жителі містечка 70% кавказьких, 25% афроамериканців і 5% корінних американців. Крім того, жителі містечка - 51% жінок і 49% чоловіків. Також нам відомі відомості про релігійні приналежності городян. Мешканці міста - 55% протестантів, 25% католиків, 10% євреїв та 10% мусульман. Тепер, якщо дослідник збирається опитувати жителів цього міста про їхню політичну приналежність, дослідник повинен зібрати вибірку, яка є репрезентативною для всього населення. Якщо дослідник використовує вибірку квот, то дослідник спробує штучно створити переріз міста, наполягаючи на тому, що його зразок повинен бути 70% кавказьким, 25% афроамериканцем та 5% корінним американцем. Крім того, дослідник хотів би, щоб його зразок становив 51% жінок та 49% чоловіків. Крім того, дослідник хотів би, щоб його зразок був 55% протестантським, 25% католиком, 10% єврейським та 10% мусульманським. Це звучить як захоплююча спроба створити хороший зразок, але цей метод має великі проблеми з ухилом вибору.
Головне занепокоєння тут - коли дослідник перестає профілювати людей, яких він буде обстежувати? Поки дослідник перетинав жителів міста за расою, статтю та релігією, але чи є ці єдиними відмінностями між людьми? А як щодо соціально-економічного статусу, віку, освіти, залученості до громади тощо? Це все впливи на політичну приналежність окремих осіб. Таким чином, проблема з вибіркою квот полягає в тому, що щоб зробити це правильно, потрібно враховувати всі відмінності між жителями міста. Якщо ви перетинаєте місто до всіх можливих різниць між людьми, ви в кінцевому підсумку з окремими особами, так що вам доведеться оглянути все місто, щоб отримати точний результат. Весь сенс створення вибірки полягає в тому, щоб вам не довелося обстежувати всю сукупність, так який сенс квотної вибірки?
Примітка: Опитування Gallup використовувало вибірку квот в минулому, але більше не використовує його.
Як випливає з назви цієї методики відбору проб, основою зручності вибірки є використання будь-якого методу, який є простим і зручним для слідчого. Цей тип техніки вибірки створює ситуацію, коли випадкова вибірка не досягається. Тому вибірка буде упередженою, оскільки вибірка не є репрезентативною для всієї популяції.
Наприклад, якщо ви стоїте поза Демократичною національною конвенцією, щоб опитувати людей, які виходять з конвенції, про свої політичні погляди. Це може бути зручний спосіб збору даних, але вибірка не буде репрезентативною для всієї популяції.
З усіх типів вибірки найкращим типом є випадкова вибірка. Іноді, це може бути важко зібрати ідеальний випадковий зразок, оскільки отримати список всіх людей випадковим чином вибрати з може бути важко зробити.
Визначте, чи є тип вибірки простий випадковий зразок, стратифікований зразок, систематична вибірка, кластерна вибірка, зразок квоти або зручну вибірку.
Рішення
- Дослідник хоче визначити різні види дерев, які знаходяться в Національному лісі Коконіно. Вона ділить ліс за допомогою системи сітки. Потім вона випадковим чином вибирає 20 різних розділів і записує види кожного дерева в кожному з обраних розділів.
Це кластерна вибірка, так як вона випадковим чином вибирала деякі групи, і всі особини в обраних групах були обстежені.
- Опитування стоїть перед продуктовим магазином органічних продуктів і запитує людей, які виходять з магазину, наскільки вони стурбовані пестицидами в їжі.
Це зручність зразка, так як людина просто виділяється перед одним магазином. Швидше за все, люди, які залишають продуктовий магазин органічних продуктів, стурбовані пестицидами в їжі, тому зразок буде упередженим.
- Дослідницький центр Pew хоче визначити рівень освіти матерів. Вони випадково просять матерів сказати, чи мали вони якусь середню школу, закінчили середню школу, якийсь коледж, закінчили коледж або передовий ступінь.
Це простий випадковий зразок, оскільки особини були підібрані випадковим чином.
- Штат Пенн хоче визначити зарплати своїх випускників за спеціальностями сільськогосподарських наук, бізнесу, інженерії та освіти. Вони випадково запитують 50 випускників сільськогосподарських наук, 100 випускників бізнесу, 200 випускників інженерних та 75 випускників освіти, які їхні зарплати.
Це стратифікований зразок, так як використовувалися всі групи, а потім були взяті випадкові зразки всередині кожної групи.
- Для того, щоб Ford Motor Company забезпечила якість своїх автомобілів, вони тестують кожен 130-й автомобіль, що виходить з конвеєра свого складального заводу в Огайо в Ейвон-Лейк, штат Огайо.
Це систематичний зразок, оскільки вони підбирали кожен 130-й автомобіль.
- Міська рада хоче дізнатися думку своїх мешканців щодо нового регіонального плану. Місто 45% кавказьких, 25% афроамериканців, 20% азіатських і 10% корінних американців. Це також 55% християнин, 25% євреїв, 12% ісламський і 8% атеїст. Крім того, 8% міста не закінчили середню школу, 12% закінчили середню школу, але ніколи не пішли до коледжу, 16% мали коледж, 45% отримали ступінь бакалавра, а 19% отримали ступінь аспірантури. Тож міська рада вирішує, що вибірка жителів буде взята так, щоб вона віддзеркалювала ці поломки.
Це зразок квоти, так як намагалися підібрати людей, які вписуються в ці підкатегорії.