10.2: Популяції та зразки
- Page ID
- 66234
Перш ніж ми почнемо збирати та аналізувати дані, нам потрібно охарактеризувати населення, яке ми вивчаємо. Якщо ми хочемо вивчити суму грошей, витрачених на підручники типовим студентом першого курсу коледжу, наше населення може бути все студенти першого курсу вашого коледжу. Або це може бути:
- Всі студенти коледжу першого курсу в штаті Вашингтон.
- Всі студенти першого курсу в державних коледжах і університетах штату Вашингтон.
- Всі студенти першого курсу у всіх коледжах і університетах штату Вашингтон.
- Всі студенти першого курсу у всіх коледжах та університетах у всіх Сполучених Штатах.
- І так далі.
Населення дослідження - це група, для опису якої призначені зібрані дані.
Іноді передбачувану популяцію називають цільовою популяцією, оскільки якщо ми розробляємо наше дослідження погано, зібрані дані можуть насправді не бути репрезентативними для передбачуваної популяції.
Чому важливо вказувати чисельність населення? Ми можемо отримати різні відповіді на наше запитання, оскільки ми змінюємо населення, яке ми вивчаємо. Студенти першого курсу Вашингтонського університету можуть пройти трохи більш різноманітні курси, ніж ті, що навчаються у вашому коледжі, і деякі з цих курсів можуть вимагати менш популярних підручників, які коштують більше; або, з іншого боку, університетський книжковий магазин може мати більший пул використовуваних підручників, знижуючи вартість ці книжки студентам. Який би випадок (і цілком ймовірно, що певна комбінація цих та інших факторів грає), дані, які ми збираємо з вашого коледжу, ймовірно, не будуть такими ж, як дані з Вашингтонського університету. Особливо, коли ми передаємо наші результати іншим, ми хочемо чітко розуміти населення, яке ми описуємо за допомогою наших даних.
Веб-сайт газети містить опитування, запитуючи людей їхню думку щодо недавньої статті новин. Що таке населення?
Рішення
Хоча цільовим (передбачуваним) населенням, можливо, були всі люди, реальне населення опитування є читачами веб-сайту.
Якби ми змогли зібрати дані по кожному члену нашого населення, скажімо, середню (більш ретельно визначимо «середню» в наступному розділі) суму грошей, витрачених на підручники кожним студентом першого курсу вашого коледжу протягом 2009-2010 навчального року, отримане число називалося б параметр.
Параметр - це значення (середнє, відсоток тощо), обчислене з використанням всіх даних популяції
Однак ми рідко бачимо параметри, оскільки опитування цілого населення зазвичай є дуже трудомістким і дорогим, якщо тільки населення не дуже маленьке або ми вже маємо зібрані дані.
Опитування цілого населення називається переписом.
Ви, напевно, знайомі з двома загальними переписами: офіційним урядовим переписом населення, який намагається підрахувати населення США кожні десять років, і голосування, яке запитує думку всіх правомочних виборців в окрузі. Перша з них демонструє одну додаткову проблему з переписом: труднощі в пошуку та отриманні участі від усіх у великому населенні, що може зміщувати або перекошувати результати.
Іноді трапляються випадки, коли перепис є доречним, як правило, коли населення досить мало. Наприклад, якщо менеджер Starbucks хотів дізнатися середню кількість годин, які її співробітники відпрацювали минулого тижня, вона повинна мати можливість підтягнути облік заробітної плати або запитати кожного співробітника безпосередньо.
Оскільки опитування цілого населення часто недоцільно, ми зазвичай підбираємо зразок для вивчення;
Вибірка - це менша підмножина всієї популяції, в ідеалі та, яка є досить репрезентативною для всієї популяції.
Більш детально ми обговоримо методи відбору проб в наступному розділі. А поки припустимо, що зразки підібрані відповідним чином. Якщо ми опитуємо вибірку, скажімо, 100 студентів першого курсу вашого коледжу, і знайдемо середню суму грошей, витрачених цими учнями на підручники, отримане число називається статистикою.
Статистика - це значення (середнє, відсоток тощо), обчислене за даними вибірки.
Дослідник хотів дізнатися, як громадяни Такоми ставляться до ініціативи виборців. Щоб вивчити це, вона йде в торговий центр Tacoma і випадковим чином вибирає 500 покупців і запитує їх думку. 60% вказують на те, що підтримують ініціативу. Що таке вибірка і чисельність населення? Чи є значення 60% параметром або статистикою?
Рішення
Зразок - це 500 опитаних покупців. Чисельність населення менш ясна. Хоча передбачуваним населенням цього опитування були громадяни Такома, ефективним населенням були покупці торгових центрів. Немає підстав припускати, що опитані 500 покупців будуть представниками всіх громадян Tacoma.
Значення 60% базувалося на вибірці, тому це статистика.
Щоб визначити середню довжину форелі в озері, дослідники виловлюють 20 риб і вимірюють їх. Яка вибірка і популяція в цьому дослідженні?
- Відповідь
-
Зразок - 20 виловлених риб. Населення - це вся риба в озері. Вибірка може бути дещо непредставницькою популяції, оскільки не вся риба може бути досить великою, щоб зловити приманку.
Коледж повідомляє, що середній вік їхніх студентів становить 28 років. Це статистика чи параметр?
- Відповідь
-
Це параметр, оскільки коледж мав би доступ до даних про всіх студентів (населення)