Processing math: 100%
Skip to main content
LibreTexts - Ukrayinska

Що таке дані?

СО-1: Опишіть ролі, яку виконує біостатистика в дисципліні охорони здоров'я.

Перш ніж ми перейдемо до Exploratory Data Analysis і дійсно оцінимо його важливість в процесі статистичного аналізу, давайте зробимо крок назад на хвилину і запитаємо:

Що ми насправді маємо на увазі під даними?

Цілі навчання

LO 1.4: Визначте основні терміни щодо даних та розпізнайте загальні варіації термінології.

Відео

Що таке дані? (2:49)

Дані - це фрагменти інформації про осіб, організовані в змінні.

  • Під індивідом ми маємо на увазі конкретну людину або об'єкт.
  • Під змінною ми маємо на увазі особливу характеристику індивіда.

Набір даних - це набір даних, ідентифікованих за певним експериментом, сценарієм або обставиною.

Набори даних зазвичай відображаються в таблицях, в яких рядки представляють окремих осіб, а стовпці представляють змінні.

ПРИКЛАД: Медичні записи

Наступний набір даних показує медичні записи для вибірки пацієнтів.

Таблиця, в якій рядки представляють пацієнтів, а кожен стовпець представляє змінну. Наприклад, третій рядок призначений для Пацієнт #3, а кожна клітинка в рядку знаходиться в певному стовпчику. Перший стовпець - Стать, а стать пацієнта #3 - жіночий, тому в першому стовпці третього рядка є 'F'.

У цьому прикладі

  • індивіди - пацієнти,
  • і змінними є стать, вік, вага, зріст, куріння, і раса.

Кожен рядок, таким чином, дає нам всю інформацію про конкретну індивіда (в даному випадку пацієнта), і кожен стовпець дає нам інформацію про ту чи іншу характеристику всіх пацієнтів.

Особи, спостереження або випадки

Примітка

Рядки в наборі даних (що представляють окремих осіб) також можуть називатися спостереженнями, випадками або описом, специфічним для окремих осіб та сценарію.

Наприклад, якби ми були зацікавлені у вивченні щеплень від грипу у школярів по всій території США, ми могли б зібрати дані, де кожне спостереження було

  • студент
  • школа
  • шкільний округ
  • місто
  • графство
  • держава

Кожен з них призведе до різного способу дослідження питань про щеплення від грипу у школярів.

Незалежні спостереження

Примітка

У нашому курсі ми представимо методи, які можна використовувати, коли аналізуються спостереження незалежні один від одного. Якщо спостереження (рядки в нашому наборі даних) не є незалежними, потрібен більш складний аналіз.Чіткі порушення незалежних спостережень виникають при

  • у нас є більше одного рядка для конкретної людини, наприклад, якщо ми збираємо однакові вимірювання в різний час для людей у нашому дослідженні
  • особини в парі або певним чином підібрані.

Починаючи цей курс, ви повинні почати з усвідомлення типів даних, з якими ми будемо працювати, і навчитися розпізнавати ситуації, які є більш складними, ніж ті, що розглядаються в цьому курсі.

Змінні

Примітка

Стовпці в наборі даних (що представляють змінні) часто групуються та позначені їх роллю в нашому аналізі.

Наприклад, у багатьох дослідженнях за участю людей ми часто збираємо демографічні змінні, такі як стать, вік, раса, етнічна приналежність, соціально-економічний стан, сімейний стан та багато іншого.

Примітка

Також слід враховувати роль, яку змінна відіграє в нашому аналізі.

  • У дослідженнях, де ми хочемо передбачити одну змінну, використовуючи одну або кілька змінних, змінна, яку ми хочемо передбачити, зазвичай називається змінною відповіді, змінною результату або залежною змінною.
  • Будь-яка змінна, яку ми використовуємо для прогнозування або пояснення відмінностей у результаті, зазвичай називається пояснювальною змінною, незалежною змінною, змінною предиктора або коваріатом.

Різні види використання терміна НЕЗАЛЕЖНИЙ в статистиці

Примітка: Слово «незалежний» використовується в статистиці численними способами. Будьте уважні, щоб зрозуміти, яким чином використовуються слова «незалежний» або «незалежність» (а також залежність або залежність), коли ви бачите їх використані в матеріалах.

  • Тут ми обговорили незалежні спостереження (також називаються випадками, окремими особами або суб'єктами).
  • Ми також використовували термін незалежна змінна як інший термін для наших пояснювальних змінних.
  • Пізніше ми дізнаємося формальні визначення ймовірностей незалежних подій і залежних подій.
  • А при порівнянні груп ми будемо визначати незалежні зразки і залежні зразки.