Skip to main content
LibreTexts - Ukrayinska

10.3: Класифікація даних

  • Page ID
    66250
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Після того, як ми зібрали дані, ми, можливо, забажаємо класифікувати їх. Грубо кажучи, дані можна класифікувати як категоричні дані або кількісні дані.

    Кількісні та категоріальні дані

    • Категоричні (якісні) дані - це фрагменти інформації, які дозволяють класифікувати досліджувані об'єкти за різними категоріями.
    • Кількісні дані - це відповіді, які носять числовий характер і за допомогою яких ми можемо виконувати значущі арифметичні обчислення.

    Приклад 3

    Ми могли б провести опитування, щоб визначити назву улюбленого фільму, який кожна людина в класі математики бачила в кінотеатрі.

    Коли ми проводимо таке опитування, відповіді виглядатимуть так: «У пошуках Немо», «Халк» або «Термінатор 3: Підйом машин». Ми можемо порахувати кількість людей, які дають кожну відповідь, але самі відповіді не мають числових значень: ми не можемо виконувати обчислення з відповіддю на кшталт "Пошук Немо». Це були б категоричні дані.

    Приклад 4

    Опитування може запитати кількість фільмів, які ви бачили в кінотеатрі за останні 12 місяців (0, 1, 2, 3, 4,...)

    Це були б кількісні дані.

    Іншими прикладами кількісних даних буде час роботи фільму, який ви бачили останнім часом (104 хвилини, 137 хвилин, 104 хвилини,...) або сума грошей, яку ви заплатили за квиток у кіно в останній раз, коли ви ходили в кінотеатр ($5.50, $7.75, $9,...).

    Іноді визначення того, чи є дані категоричними чи кількісними, може бути трохи складнішим.

    Приклад 5

    Припустимо, ми збираємо поштові індекси респондентів в опитуванні, щоб відстежувати їх географічне положення.

    Поштові індекси - це цифри, але ми не можемо робити з ними жодних значущих математичних обчислень (немає сенсу говорити, що 98036 - це «двічі» 49018 - це все одно, що сказати, що Лінвуд, штат Вашингтон - це «двічі» Battle Creek, MI, що взагалі не має сенсу), тому поштові коди дійсно категоричні дані.

    Приклад 6

    Опитування про фільм, який ви останнім часом відвідували, включає питання «Як би ви оцінювали фільм, який ви щойно бачили?» з цими можливими відповідями:

    1 - це було жахливо
    2 - це було просто ОК
    3 - мені сподобалося
    4 - це було чудово
    5 - найкращий фільм коли-небудь!

    Знову ж таки, є цифри, пов'язані з відповідями, але ми не можемо робити будь-які розрахунки з ними: фільм, який оцінює 4, не обов'язково вдвічі більше, ніж фільм, який оцінює 2, що б це не означало; якщо двоє людей бачать фільм, і один з них думає, що смердить, а інший вважає, що це найкраще коли-небудь не обов'язково має сенс говорити, що «в середньому їм це сподобалося».

    Вивчаючи звички та переваги в кіно, ми не повинні забувати вказувати розглянуту популяцію. Якщо ми опитуємо 3-7 річних, улюбленим втечею може бути Пошук Немо. 13-17-річні можуть віддати перевагу Термінатор 3. А 33-37-річні можуть віддати перевагу... ну, Пошук Немо.

    Спробуйте зараз 3

    Класифікувати кожне вимірювання як категоричне або кількісне

    1. Колір очей групи людей
    2. Добова висока температура міста протягом декількох тижнів
    3. Річний дохід
    Відповідь
    1. Категоричний
    2. Кількісні
    3. Кількісні