2: Робота з даними
Having read this chapter, you should be able to:
- Distinguish between different types of variables (quantitative/qualitative, binary/integer/real, discrete/continuous) and give examples of each of these kinds of variables
- Distinguish between the concepts of reliability and validity and apply each concept to a particular dataset
- 2.1: Що таке дані?
- Першим важливим моментом щодо даних є те, що дані - це означає, що слово «дані» є множиною (хоча деякі люди зі мною не згодні з цього приводу). Ви також можете задатися питанням, як вимовляти «дані» - я кажу «день-тах», але я знаю багатьох людей, які говорять «dah-tah», і я зміг залишитися друзями з ними, незважаючи на це. Тепер, якби я почув, як вони кажуть «дані», то це було б більшою проблемою...
- 2.2: Дискретні проти безперервних вимірювань
- Дискретне вимірювання - це той, який приймає одне з набору певних значень. Це можуть бути якісні значення (наприклад, різні породи собак) або числові значення (наприклад, скільки друзів у одного на Facebook). Безперервне вимірювання - це той, який визначається з точки зору дійсного числа. Він може впасти в будь-якому місці певного діапазону значень, хоча зазвичай наші вимірювальні інструменти обмежують точність, з якою ми можемо вимірювати.
- 2.5: Що робить хороше вимірювання?
- Зазвичай неможливо виміряти конструкцію без певної кількості похибки. У наведеному вище прикладі ви можете знати відповідь, але ви можете неправильно прочитати питання і помилитися. В інших випадках існує помилка, властива вимірюваної речі, наприклад, коли ми вимірюємо, скільки часу потрібно людині, щоб відповісти на простий тест часу реакції, який буде змінюватися від випробування до випробування з багатьох причин. Як правило, ми хочемо, щоб наша похибка вимірювання була якомога нижчою.