Класифікація типів змінних
Цілі навчання
LO 4.1: Визначте тип (категоричний або кількісний) заданої змінної.
Цілі навчання
LO 4.2: Класифікуйте задану змінну як номінальну, порядкову, дискретну або безперервну.
Змінні можуть бути широко класифіковані на один з двох типів:
Нижче ми визначимо ці два основні типи змінних і надаємо подальші підкласифікації для кожного типу.
Примітка
Категоричні змінні приймають значення категорії або мітки і поміщають індивіда в одну з декількох груп.
Категоричні змінні часто додатково класифікуються як:
- Номінальний, коли немає природного впорядкування серед категорій.
Поширеними прикладами можуть бути стать, колір очей або етнічна приналежність.
- Порядковий, коли існує природний порядок серед категорій, наприклад, шкали ранжирування або літерні оцінки.
Однак порядкові змінні все ще категоричні і не забезпечують точних вимірювань.
Відмінності не є точно значущими, наприклад, якщо один студент набирає A, а інший A B за завданням, ми не можемо точно сказати різницю в їх балах, лише те, що A більше, ніж B.
Примітка
Кількісні змінні приймають числові значення, і являють собою якесь вимірювання.
Кількісні змінні часто додатково класифікуються як:
- Дискретний, коли змінна приймає на себе зліченну кількість значень.
Найчастіше ці змінні дійсно представляють якусь кількість таких як кількість рецептів, які людина приймає щодня.
- Безперервна, коли змінна може приймати будь-яке значення в деякому діапазоні значень.
Наша точність вимірювання цих змінних часто обмежується нашими приладами.
Одиниці повинні бути передбачені.
Поширеними прикладами можуть бути висота (дюйми), вага (фунти) або час до відновлення (дні).
Один спеціальний тип змінної виникає, коли змінна має лише два можливих значення.
Примітка
Змінна, як кажуть, двійковий або дихотомний, коли існує лише два можливі рівні.
Ці змінні зазвичай можна сформулювати в питанні «так/ні». Незалежно від того, чи є хтось курцем, є прикладом двійкової змінної.
В даний час ми в першу чергу займаємося класифікацією змінних як категоричних, так і кількісних.
Іноді, однак, нам потрібно буде розглянути далі і підкласифікувати ці змінні, як визначено вище.
Ці поняття будуть обговорюватися та розглядатися в міру необхідності, але ось швидка практика щодо підкласифікації категоріальних та кількісних змінних.
ПРИКЛАД: Медичні записи
Давайте переглянемо набір даних, що показує медичні записи для вибірки пацієнтів
У нашому прикладі медичної документації є кілька змінних кожного типу:
- Вік, вага і зріст є кількісними змінними.
- Раса, стать і куріння є категоричними змінними.
Коментарі:
- Зверніть увагу, що значення категоріальної змінної Smoking були закодовані як цифри 0 або 1.
Досить часто кодувати значення категоріальної змінної як числа, але слід пам'ятати, що це всього лише коди.
Вони не мають арифметичного значення (тобто не має сенсу складати, віднімати, множити, ділити або порівнювати величину таких значень).
Зазвичай, якщо таке кодування використовується, всі категоріальні змінні будуть закодовані, і ми будемо, як правило, робити цей тип кодування для наборів даних в цьому курсі.
- Іноді кількісні змінні поділяють на групи для аналізу, в такій ситуації, хоча вихідна змінна була кількісною, аналізована змінна категорична.
Поширеним прикладом є надання інформації про індексу маси тіла людини, вказуючи, чи є людина недостатньою вагою, нормальним, надмірною вагою або ожирінням.
Цей класифікований ІМТ є прикладом порядкової категоріальної змінної.
- Категоричні змінні іноді називають якісними змінними, але в цьому курсі ми будемо використовувати термін «категоричний».