Skip to main content
LibreTexts - Ukrayinska

8.2: Категоризація даних

  • Page ID
    66567
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Після того, як ми зібрали дані, ми, можливо, забажаємо класифікувати їх. Грубо кажучи, дані можна класифікувати як категоричні дані або кількісні дані.

    Визначення: Кількісні та категоріальні дані

    Категоричні (якісні) дані - це фрагменти інформації, які дозволяють класифікувати досліджувані об'єкти за різними категоріями.

    Кількісні дані - це відповіді, які носять числовий характер і за допомогою яких ми можемо виконувати значущі арифметичні обчислення.

    Приклад\(\PageIndex{1}\)

    Ми могли б провести опитування, щоб визначити назву улюбленого фільму, який кожна людина в класі математики бачила в кінотеатрі.

    Коли ми проводимо таке опитування, відповіді виглядатимуть так: «У пошуках Немо», «Халк» або «Термінатор 3: Підйом машин». Ми можемо порахувати кількість людей, які дають кожну відповідь, але самі відповіді не мають числових значень: ми не можемо виконувати обчислення з відповіддю на кшталт «Пошук Немо». Це були б категоричні дані.

    Приклад\(\PageIndex{2}\)

    Опитування може запитати кількість фільмів, які ви бачили в кінотеатрі за останні 12 місяців (0, 1, 2, 3, 4,...).

    Це були б кількісні дані.

    Іншими прикладами кількісних даних буде час роботи фільму, який ви бачили останнім часом (104 хвилини, 137 хвилин, 104 хвилини,...) або сума грошей, яку ви заплатили за квиток у кіно в останній раз, коли ви ходили в кінотеатр ($5.50, $7.75, $9,...).

    Іноді визначення того, чи є дані категоричними чи кількісними, може бути трохи складнішим.

    Приклад\(\PageIndex{3}\)

    Припустимо, ми збираємо поштові індекси респондентів в опитуванні, щоб відстежувати їх географічне положення.

    Поштові індекси - це цифри, але ми не можемо робити з ними жодних значущих математичних обчислень (немає сенсу говорити, що 98036 - це «двічі» 49018 - це все одно, що сказати, що Лінвуд, штат Вашингтон - це «двічі» Battle Creek, MI, що взагалі не має сенсу), тому поштові коди дійсно категоричні дані.

    Приклад\(\PageIndex{4}\)

    Опитування про фільм, який ви останнім часом відвідували, включає питання «Як би ви оцінювали фільм, який ви щойно бачили?» з цими можливими відповідями:

    1 - було жахливо

    2 - це було просто нормально

    3 - Мені сподобалося

    4 - було здорово

    5 - найкращий фільм коли-небудь!

    Знову ж таки, є цифри, пов'язані з відповідями, але ми не можемо робити будь-які розрахунки з ними: фільм, який оцінює 4, не обов'язково вдвічі більше, ніж фільм, який оцінює 2, що б це не означало; якщо двоє людей бачать фільм, і один з них думає, що смердить, а інший вважає, що це найкраще коли-небудь не обов'язково має сенс говорити, що «в середньому їм це сподобалося».

    Вивчаючи звички та переваги в кіно, ми не повинні забувати вказувати розглянуту популяцію. Якщо ми опитуємо 3-7-річних дітей, улюбленим втікачем може бути пошук Немо, а 13-17-річні можуть віддати перевагу Термінатору 3, а 33-37-річні можуть віддати перевагу... ну, Пошук Немо.

    Спробуйте зараз 3

    Класифікувати кожне вимірювання як категоричне або кількісне

    а. колір очей групи людей

    b. щоденна висока температура міста протягом декількох тижнів

    c. річний дохід