6.3: Збір даних
Цілі навчання
- Опишіть, як повинна записуватися така змінна, як висота
- Виберіть хорошу шкалу відповідей для анкети
Більшість статистичних аналізів вимагають, щоб ваші дані були в числовій, а не словесній формі (ви не можете пробивати літери в калькулятор). Тому дані, зібрані в словесній формі, повинні бути закодовані так, щоб вони були представлені цифрами. Для ілюстрації розглянемо дані в табл6.3.1.
Ім'я студента | Колір волосся | Стать | майор | Висота | Комп'ютерний досвід |
---|---|---|---|---|---|
Норма | Коричневий | Жіноча | Психологія | 5'4» | Лоти |
Бурштин | Блондинка | Жіноча | Соціальні науки | 5'7» | Дуже мало |
Пол | Блондинка | Чоловічий | Історія | 6'1» | Помірний |
Крістофер | Чорний | Чоловічий | Біологія | 5'10» | Лоти |
Соня | Коричневий | Жіноча | Психологія | 5'4» | Маленький |
Чи можете ви провести статистичний аналіз за вищезазначеними даними або ви повинні перекодувати їх якимось чином? Наприклад, як би ви йшли про обчислення середнього зросту5 учнів. Ви не можете ввести висоту студентів в їх поточній формі в статистичну програму - комп'ютер, ймовірно, дасть вам повідомлення про помилку, тому що він не розуміє позначення, такі як5′4”. Одним з рішень є зміна всіх чисел на дюйми. Отже,5′4” стає(5×12)+4=64, і6′1” стає(6×12)+1=73, і так далі. Таким чином, ви перетворюєте висоту в футах і дюймах на просто висоту в дюймах. Звідти дуже легко попросити статистичну програму для обчислення середньої висоти в дюймах для5 студентів.
Ви можете запитати: «Чому б просто не попросити випробовуваних написати їх зростання в дюймах в першу чергу?» Що ж, правило номер один збору даних - запитувати інформацію таким чином, як вона буде найбільш точно повідомлена. Більшість людей знають свій зріст у футах і дюймах і не можуть швидко і точно перетворити його в дюйми «на льоту». Отже, щоб зберегти точність даних, дослідникам найкраще зробити необхідні перетворення.
Візьмемо інший приклад. Припустимо, ви хотіли розрахувати середню кількість комп'ютерного досвіду для п'яти учнів, показаних в табл6.3.1. Одним із способів було б перетворити словесні описи в числа, як показано в таблиці6.3.2. Таким чином, «Дуже мало» буде перетворено на "1", а «Маленький» буде перетворений на "»2.
1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|
Дуже мало | Маленький | Помірний | Лоти | Дуже багато |
Приклад6.3.1: How much information should I record?
Скажімо, ви волонтерство на треку зустрітися у вашому коледжі, і ваша робота полягає в тому, щоб записати час кожного бігуна, як вони проходять фінішну лінію для кожної гонки. Їх час відображається великими червоними цифрами на цифровому годиннику з вісьмома цифрами праворуч від десяткової крапки, і вам кажуть записати все число в свій планшет. Думаючи вісім десяткових знаків трохи надмірно, ви записуєте лише раз бігунів до одного знака після коми. Починається зустріч доріжки, а бігун номер один закінчується з часом у22.93219780 секунди. Ви покірно записуєте її час у своєму планшеті, але тільки до одного знака після коми, тобто22.9. Гонка номер два закінчується, і ви записуєте32.7 для переможного бігуна. Найшвидший час у гонці номер три25.6. Гонка номер чотири виграшний час є22.9, гонка номер п'ять є... Але почекайте! Ви раптом усвідомлюєте свою помилку; тепер у вас є зв'язок між бігуном один і бігун чотири для титулу найшвидшого загального бігуна! Ви повинні були записати більше інформації з цифрового годинника - ця інформація тепер втрачена, і ви не можете повернутися назад у часі і записувати час роботи до більшої кількості десяткових знаків.
Справа в тому, що ви повинні дуже ретельно продумати масштаби і специфіку інформації, необхідної в ваших дослідженнях, перш ніж приступити до збору даних. Якщо ви вважаєте, що вам може знадобитися додаткова інформація пізніше, але не впевнені, виміряйте її; ви завжди можете вирішити не використовувати деякі дані або «згорнути» свої дані до нижчих масштабів, якщо хочете, але ви не можете розширити свій набір даних, щоб включити більше інформації після факту. У цьому прикладі вам, ймовірно, не потрібно буде записувати вісім цифр праворуч від десяткової крапки. Але запис тільки однієї десяткової цифри явно занадто мало.
Приклад6.3.2
Прикиньте на мить, що ви навчаєте п'ятьох дітей у середній школі (yikes!) , і ви намагаєтеся переконати їх, що вони повинні вчитися більше, щоб заробити кращі оцінки. Щоб довести свою думку, ви вирішили зібрати фактичні дані з останніх іспитів з математики, і з цією метою ви розробляєте анкету для вимірювання часу навчання та наступних оцінок. Ви можете розробити анкету, яка виглядає наступним чином:
- Будь ласка, напишіть своє ім'я: ____________________________
- Будь ласка, вкажіть, скільки ви навчалися на цьому
іспиті з математики: багато... помірно... мало - Будь ласка, обведіть оцінку, яку ви отримали на іспиті з математики:ABCDF
З огляду на вищевказану анкету, отримані вами дані можуть виглядати наступним чином:
Ім'я | Вивчена сума | Сорт |
---|---|---|
Джон | Маленький | C |
Саллі | Помірний | Б |
Олександр | Лоти | A |
Лінда | Помірний | A |
Томас | Маленький | Б |
Очні дані, здається, ніби діти, які навчалися більше, отримували кращі оцінки, але це важко сказати. «Мало», «багато» і «B,» - це неточні, якісні терміни. Ви можете отримати більш точну інформацію, запитуючи конкретно, скільки годин вони вивчали і їх точний бал на іспиті. Тоді дані можуть виглядати наступним чином:
Ім'я | Вивчені години | % Правильно | ||||
---|---|---|---|---|---|---|
Джон | 5 | 71 | ||||
Саллі | 9 | 83 | ||||
Олександр | 13 | 97 | ||||
Лінда | 12 | 91 | ||||
Томас | 7 | 85 |
Звичайно, це припускає, що студенти знатимуть, скільки годин вони навчалися. Замість того, щоб довіряти спогадам студентів, ви можете попросити їх вести журнал свого навчального часу під час навчання.
Дописувачі та атрибуція
- Template:ContribHeblLane
- Heidi Zeimer