10.3: Класифікація даних
- Page ID
- 66250
Після того, як ми зібрали дані, ми, можливо, забажаємо класифікувати їх. Грубо кажучи, дані можна класифікувати як категоричні дані або кількісні дані.
- Категоричні (якісні) дані - це фрагменти інформації, які дозволяють класифікувати досліджувані об'єкти за різними категоріями.
- Кількісні дані - це відповіді, які носять числовий характер і за допомогою яких ми можемо виконувати значущі арифметичні обчислення.
Ми могли б провести опитування, щоб визначити назву улюбленого фільму, який кожна людина в класі математики бачила в кінотеатрі.
Коли ми проводимо таке опитування, відповіді виглядатимуть так: «У пошуках Немо», «Халк» або «Термінатор 3: Підйом машин». Ми можемо порахувати кількість людей, які дають кожну відповідь, але самі відповіді не мають числових значень: ми не можемо виконувати обчислення з відповіддю на кшталт "Пошук Немо». Це були б категоричні дані.
Опитування може запитати кількість фільмів, які ви бачили в кінотеатрі за останні 12 місяців (0, 1, 2, 3, 4,...)
Це були б кількісні дані.
Іншими прикладами кількісних даних буде час роботи фільму, який ви бачили останнім часом (104 хвилини, 137 хвилин, 104 хвилини,...) або сума грошей, яку ви заплатили за квиток у кіно в останній раз, коли ви ходили в кінотеатр ($5.50, $7.75, $9,...).
Іноді визначення того, чи є дані категоричними чи кількісними, може бути трохи складнішим.
Припустимо, ми збираємо поштові індекси респондентів в опитуванні, щоб відстежувати їх географічне положення.
Поштові індекси - це цифри, але ми не можемо робити з ними жодних значущих математичних обчислень (немає сенсу говорити, що 98036 - це «двічі» 49018 - це все одно, що сказати, що Лінвуд, штат Вашингтон - це «двічі» Battle Creek, MI, що взагалі не має сенсу), тому поштові коди дійсно категоричні дані.
Опитування про фільм, який ви останнім часом відвідували, включає питання «Як би ви оцінювали фільм, який ви щойно бачили?» з цими можливими відповідями:
1 - це було жахливо
2 - це було просто ОК
3 - мені сподобалося
4 - це було чудово
5 - найкращий фільм коли-небудь!
Знову ж таки, є цифри, пов'язані з відповідями, але ми не можемо робити будь-які розрахунки з ними: фільм, який оцінює 4, не обов'язково вдвічі більше, ніж фільм, який оцінює 2, що б це не означало; якщо двоє людей бачать фільм, і один з них думає, що смердить, а інший вважає, що це найкраще коли-небудь не обов'язково має сенс говорити, що «в середньому їм це сподобалося».
Вивчаючи звички та переваги в кіно, ми не повинні забувати вказувати розглянуту популяцію. Якщо ми опитуємо 3-7 річних, улюбленим втечею може бути Пошук Немо. 13-17-річні можуть віддати перевагу Термінатор 3. А 33-37-річні можуть віддати перевагу... ну, Пошук Немо.
Класифікувати кожне вимірювання як категоричне або кількісне
- Колір очей групи людей
- Добова висока температура міста протягом декількох тижнів
- Річний дохід
- Відповідь
-
- Категоричний
- Кількісні
- Кількісні