Skip to main content
LibreTexts - Ukrayinska

Що таке дані?

  • Page ID
    99462
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    СО-1: Опишіть ролі, яку виконує біостатистика в дисципліні охорони здоров'я.

    Перш ніж ми перейдемо до Exploratory Data Analysis і дійсно оцінимо його важливість в процесі статистичного аналізу, давайте зробимо крок назад на хвилину і запитаємо:

    Що ми насправді маємо на увазі під даними?

    Цілі навчання

    LO 1.4: Визначте основні терміни щодо даних та розпізнайте загальні варіації термінології.

    Відео

    Що таке дані? (2:49)

    Дані - це фрагменти інформації про осіб, організовані в змінні.

    • Під індивідом ми маємо на увазі конкретну людину або об'єкт.
    • Під змінною ми маємо на увазі особливу характеристику індивіда.

    Набір даних - це набір даних, ідентифікованих за певним експериментом, сценарієм або обставиною.

    Набори даних зазвичай відображаються в таблицях, в яких рядки представляють окремих осіб, а стовпці представляють змінні.

    ПРИКЛАД: Медичні записи

    Наступний набір даних показує медичні записи для вибірки пацієнтів.

    Таблиця, в якій рядки представляють пацієнтів, а кожен стовпець представляє змінну. Наприклад, третій рядок призначений для Пацієнт #3, а кожна клітинка в рядку знаходиться в певному стовпчику. Перший стовпець - Стать, а стать пацієнта #3 - жіночий, тому в першому стовпці третього рядка є 'F'.

    У цьому прикладі

    • індивіди - пацієнти,
    • і змінними є стать, вік, вага, зріст, куріння, і раса.

    Кожен рядок, таким чином, дає нам всю інформацію про конкретну індивіда (в даному випадку пацієнта), і кожен стовпець дає нам інформацію про ту чи іншу характеристику всіх пацієнтів.

    Особи, спостереження або випадки

    Примітка

    Рядки в наборі даних (що представляють окремих осіб) також можуть називатися спостереженнями, випадками або описом, специфічним для окремих осіб та сценарію.

    Наприклад, якби ми були зацікавлені у вивченні щеплень від грипу у школярів по всій території США, ми могли б зібрати дані, де кожне спостереження було

    • студент
    • школа
    • шкільний округ
    • місто
    • графство
    • держава

    Кожен з них призведе до різного способу дослідження питань про щеплення від грипу у школярів.

    Незалежні спостереження

    Примітка

    У нашому курсі ми представимо методи, які можна використовувати, коли аналізуються спостереження незалежні один від одного. Якщо спостереження (рядки в нашому наборі даних) не є незалежними, потрібен більш складний аналіз.Чіткі порушення незалежних спостережень виникають при

    • у нас є більше одного рядка для конкретної людини, наприклад, якщо ми збираємо однакові вимірювання в різний час для людей у нашому дослідженні
    • особини в парі або певним чином підібрані.

    Починаючи цей курс, ви повинні почати з усвідомлення типів даних, з якими ми будемо працювати, і навчитися розпізнавати ситуації, які є більш складними, ніж ті, що розглядаються в цьому курсі.

    Змінні

    Примітка

    Стовпці в наборі даних (що представляють змінні) часто групуються та позначені їх роллю в нашому аналізі.

    Наприклад, у багатьох дослідженнях за участю людей ми часто збираємо демографічні змінні, такі як стать, вік, раса, етнічна приналежність, соціально-економічний стан, сімейний стан та багато іншого.

    Примітка

    Також слід враховувати роль, яку змінна відіграє в нашому аналізі.

    • У дослідженнях, де ми хочемо передбачити одну змінну, використовуючи одну або кілька змінних, змінна, яку ми хочемо передбачити, зазвичай називається змінною відповіді, змінною результату або залежною змінною.
    • Будь-яка змінна, яку ми використовуємо для прогнозування або пояснення відмінностей у результаті, зазвичай називається пояснювальною змінною, незалежною змінною, змінною предиктора або коваріатом.

    Різні види використання терміна НЕЗАЛЕЖНИЙ в статистиці

    Примітка: Слово «незалежний» використовується в статистиці численними способами. Будьте уважні, щоб зрозуміти, яким чином використовуються слова «незалежний» або «незалежність» (а також залежність або залежність), коли ви бачите їх використані в матеріалах.

    • Тут ми обговорили незалежні спостереження (також називаються випадками, окремими особами або суб'єктами).
    • Ми також використовували термін незалежна змінна як інший термін для наших пояснювальних змінних.
    • Пізніше ми дізнаємося формальні визначення ймовірностей незалежних подій і залежних подій.
    • А при порівнянні груп ми будемо визначати незалежні зразки і залежні зразки.
    • Was this article helpful?