СО-1: Опишіть ролі, яку виконує біостатистика в дисципліні охорони здоров'я.
Перш ніж ми перейдемо до Exploratory Data Analysis і дійсно оцінимо його важливість в процесі статистичного аналізу, давайте зробимо крок назад на хвилину і запитаємо:
Що ми насправді маємо на увазі під даними?
Цілі навчання
LO 1.4: Визначте основні терміни щодо даних та розпізнайте загальні варіації термінології.
Дані - це фрагменти інформації про осіб, організовані в змінні.
- Під індивідом ми маємо на увазі конкретну людину або об'єкт.
- Під змінною ми маємо на увазі особливу характеристику індивіда.
Набір даних - це набір даних, ідентифікованих за певним експериментом, сценарієм або обставиною.
Набори даних зазвичай відображаються в таблицях, в яких рядки представляють окремих осіб, а стовпці представляють змінні.
ПРИКЛАД: Медичні записи
Наступний набір даних показує медичні записи для вибірки пацієнтів.
У цьому прикладі
- індивіди - пацієнти,
- і змінними є стать, вік, вага, зріст, куріння, і раса.
Кожен рядок, таким чином, дає нам всю інформацію про конкретну індивіда (в даному випадку пацієнта), і кожен стовпець дає нам інформацію про ту чи іншу характеристику всіх пацієнтів.
Особи, спостереження або випадки
Примітка
Рядки в наборі даних (що представляють окремих осіб) також можуть називатися спостереженнями, випадками або описом, специфічним для окремих осіб та сценарію.
Наприклад, якби ми були зацікавлені у вивченні щеплень від грипу у школярів по всій території США, ми могли б зібрати дані, де кожне спостереження було
- студент
- школа
- шкільний округ
- місто
- графство
- держава
Кожен з них призведе до різного способу дослідження питань про щеплення від грипу у школярів.
Незалежні спостереження
Примітка
У нашому курсі ми представимо методи, які можна використовувати, коли аналізуються спостереження незалежні один від одного. Якщо спостереження (рядки в нашому наборі даних) не є незалежними, потрібен більш складний аналіз.Чіткі порушення незалежних спостережень виникають при
- у нас є більше одного рядка для конкретної людини, наприклад, якщо ми збираємо однакові вимірювання в різний час для людей у нашому дослідженні
- особини в парі або певним чином підібрані.
Починаючи цей курс, ви повинні почати з усвідомлення типів даних, з якими ми будемо працювати, і навчитися розпізнавати ситуації, які є більш складними, ніж ті, що розглядаються в цьому курсі.
Змінні
Примітка
Стовпці в наборі даних (що представляють змінні) часто групуються та позначені їх роллю в нашому аналізі.
Наприклад, у багатьох дослідженнях за участю людей ми часто збираємо демографічні змінні, такі як стать, вік, раса, етнічна приналежність, соціально-економічний стан, сімейний стан та багато іншого.
Примітка
Також слід враховувати роль, яку змінна відіграє в нашому аналізі.
- У дослідженнях, де ми хочемо передбачити одну змінну, використовуючи одну або кілька змінних, змінна, яку ми хочемо передбачити, зазвичай називається змінною відповіді, змінною результату або залежною змінною.
- Будь-яка змінна, яку ми використовуємо для прогнозування або пояснення відмінностей у результаті, зазвичай називається пояснювальною змінною, незалежною змінною, змінною предиктора або коваріатом.
Різні види використання терміна НЕЗАЛЕЖНИЙ в статистиці
Примітка: Слово «незалежний» використовується в статистиці численними способами. Будьте уважні, щоб зрозуміти, яким чином використовуються слова «незалежний» або «незалежність» (а також залежність або залежність), коли ви бачите їх використані в матеріалах.
- Тут ми обговорили незалежні спостереження (також називаються випадками, окремими особами або суб'єктами).
- Ми також використовували термін незалежна змінна як інший термін для наших пояснювальних змінних.
- Пізніше ми дізнаємося формальні визначення ймовірностей незалежних подій і залежних подій.
- А при порівнянні груп ми будемо визначати незалежні зразки і залежні зразки.