1.3: Рівні вимірювання
Після того, як у вас є набір даних, вам потрібно буде організувати його так, щоб ви могли проаналізувати, як часто кожна дата зустрічається у наборі. Однак при обчисленні частоти вам може знадобитися округлити відповіді так, щоб вони були максимально точними.
Рівні вимірювання
Спосіб вимірювання сукупності даних називається його рівнем вимірювання. Правильні статистичні процедури залежать від того, що дослідник знайомий з рівнями вимірювання. Не кожна статистична операція може бути використана з кожним набором даних. Дані можна класифікувати на чотири рівні вимірювання. Вони бувають (від найнижчого до найвищого рівня):
- Номінальний рівень шкали
- Порядковий рівень шкали
- Рівень інтервального масштабу
- Рівень шкали співвідношення
Дані, які вимірюються за номінальною шкалою, є якісними (категоричними). Категорії, кольори, назви, етикетки та улюблені продукти разом із відповідями «так» чи «ні» є прикладами даних номінального рівня. Дані номінальної шкали не впорядковані. Наприклад, намагатися класифікувати людей за улюбленою їжею не має ніякого сенсу. Поставити піцу першим, а суші другий не має сенсу.
Смартфонні компанії - ще один приклад даних номінального масштабу. Дані - це назви компаній, які виробляють смартфони, але немає узгодженого замовлення цих брендів, хоча люди можуть мати особисті переваги. Дані номінальної шкали не можуть бути використані в розрахунках.
Дані, які вимірюються за допомогою порядкової шкали, схожі на дані номінальної шкали, але є велика різниця. Дані порядкового масштабу можна впорядкувати. Прикладом даних порядкового масштабу є список п'яти найкращих національних парків США. П'ять найкращих національних парків у Сполучених Штатах можна ранжувати від одного до п'яти, але ми не можемо виміряти відмінності між даними.
Ще одним прикладом використання порядкової шкали є круїзне опитування, де відповіді на питання про круїз «відмінно», «добре», «задовільно» та «незадовільно». Ці відповіді впорядковуються від найбільш бажаного відповіді до найменш бажаного. Але відмінності між двома частинами даних неможливо виміряти. Як і дані номінальної шкали, дані порядкової шкали не можуть бути використані в розрахунках.
Дані, які вимірюються за допомогою інтервальної шкали, схожі на дані порядкового рівня, оскільки вони мають певний порядок, але між даними існує різниця. Різниця між даними інтервальної шкали може бути виміряна, хоча дані не мають вихідної точки.
Температурні шкали, такі як Цельсія (C) і Фаренгейта (F), вимірюються за допомогою інтервальної шкали. В обох вимірах температури 40° дорівнює 100° мінус 60°. Відмінності мають сенс. Але 0 градусів не тому, що в обох масштабах 0 не є абсолютною найнижчою температурою. Такі температури, як -10° F і -15° C існують і холодніші за 0.
Дані інтервального рівня можуть бути використані в розрахунках, але один тип порівняння неможливо зробити. 80° C не в чотири рази гаряче, ніж 20° C (і 80° F в чотири рази гаряче, ніж 20° F). Немає сенсу співвідношення 80 до 20 (або чотири до одного).
Дані, які вимірюються за допомогою шкали співвідношення, піклуються про проблему співвідношення і дають вам найбільше інформації. Дані шкали співвідношення схожі на дані інтервальної шкали, але вони мають 0 балів і співвідношення можна обчислити. Наприклад, чотири множинного вибору статистики підсумкових балів іспиту складають 80, 68, 20 і 92 (з можливих 100 балів). Іспити мають машинне оцінювання.
Дані можна привести в порядок від найнижчого до найвищого: 20, 68, 80, 92.
Відмінності між даними мають сенс. Оцінка 92 більше, ніж оцінка 68 на 24 бали. Коефіцієнти можна розрахувати. Найменший бал дорівнює 0. Так 80 це чотири рази 20. Оцінка 80 в чотири рази краще, ніж оцінка 20.
Частота
Двадцять студентів запитали, скільки годин вони відпрацьовують в день. Їх відповіді, в годині, такі: 5; 6; 3; 3; 2; 4; 7; 5; 2; 3; 5; 6; 5; 4; 3; 5; 2; 5; 5; 3; 5; 3.
У таблиці1.3.5 наведено різні значення даних у порядку зростання та їх частоти.
\ (\ pageIndex {5}\) Таблиця частот роботи студентів «>Значення даних | Частота |
---|---|
2 | 3 |
3 | 5 |
4 | 3 |
5 | 6 |
6 | 2 |
7 | 1 |
Таблиця 1.5 Таблиця частот роботи студентів
Частота - це кількість разів, коли відбувається значення даних. Згідно з Табл1.3.5, є троє студентів, які працюють дві години, п'ять студентів, які працюють три години, і так далі. Сума значень у стовпці частот, 20, являє собою загальну кількість учнів, включених до вибірки.
Відносна частота - це відношення (частка або частка) кількості разів, коли значення даних відбувається в наборі всіх результатів до загальної кількості результатів. Щоб знайти відносні частоти, розділіть кожну частоту на загальну кількість студентів у вибірці - у цьому випадку 20. Відносні частоти можуть бути записані у вигляді дробів, відсотків або десяткових знаків.
\ (\ pageIndex {6}\) Таблиця частот роботи студентів з відносними частотами «>Значення даних | Частота | відносна частота |
---|---|---|
2 | 3 | 320або 0,15 |
3 | 5 | 520або 0,25 |
4 | 3 | 320або 0,15 |
5 | 6 | 620або 0,30 |
6 | 2 | 220або 0,10 |
7 | 1 | 120або 0,05 |
Таблиця 1.6 Частотна таблиця робочих годин студентів з відносними частотами
Сума значень у стовпці відносної частоти таблиці1.3.6 дорівнює2020, або 1.
Накопичувальна відносна частота - це накопичення попередніх відносних частот. Щоб знайти кумулятивні відносні частоти, додайте всі попередні відносні частоти до відносної частоти для поточного ряду, як показано в табл1.3.7.
\ (\ pageIndex {7}\) Таблиця частот робочого часу студентів з відносною та кумулятивною відносною частотами «>Значення даних | Частота | відносна частота | Накопичувальна відносна частота |
---|---|---|---|
2 | 3 | 320або 0,15 | 0,15 |
3 | 5 | 520або 0,25 | 0.15 + 0,25 = 0,40 |
4 | 3 | 320або 0,15 | 0.40 + 0,15 = 0,55 |
5 | 6 | 620або 0,30 | 0.55 + 0,30 = 0,85 |
6 | 2 | 220або 0,10 | 0.85 + 0,10 = 0,95 |
7 | 1 | 120або 0,05 | 0,95 + 0,05 = 1,00 |
Таблиця 1.7 Частотна таблиця робочих годин студентів з відносними та кумулятивними відносними частотами
Останній запис стовпця сукупної відносної частоти - один, що вказує на те, що накопичено сто відсотків даних.
ПРИМІТКА
Через округлення стовпчик відносної частоти не завжди може скласти одиницю, а останній запис у стовпці сукупної відносної частоти може бути не одним. Однак кожен з них повинен бути близький до одного.
Таблиця1.3.8 представляє висоту, в дюймах, зразка 100 чоловіків-напівпрофесійних футболістів.
\ (\ pageIndex {8}\) Таблиця частот висоти футболіста «>Висота (дюйми) | Частота | відносна частота | Накопичувальна відносна частота |
---|---|---|---|
59,95—61,95 | 5 | 510= 0,05 | 0,05 |
61,95—63,95 | 3 | 3100= 0,03 | 0.05 + 0.03 = 0.08 |
63.95—65,95 | 15 | 15100= 0,15 | 0.08 + 0,15 = 0,23 |
65.95—67,95 | 40 | 40100= 0,40 | 0,23 + 0,40 = 0,63 |
67,95—69,95 | 17 | 17100= 0,17 | 0.63 + 0.17 = 0,80 |
69.95—71,95 | 12 | 12100= 0,12 | 0.80 + 0.12 = 0.92 |
71,95—73,95 | 7 | 7100= 0,07 | 0.92 + 0.07 = 0,99 |
73,95—75,95 | 1 | 1100= 0,01 | 0,99 + 0,01 = 1,00 |
Всього = 100 | Всього = 1,00 |
Таблиця 1.8 Таблиця частот висоти футболіста
Дані в цій таблиці були згруповані за наступними інтервалами:
- Від 59,95 до 61,95 дюймів
- Від 61,95 до 63,95 дюймів
- Від 63,95 до 65,95 дюймів
- Від 65,95 до 67,95 дюймів
- Від 67.95 до 69.95 дюймів
- Від 69.95 до 71,95 дюймів
- Від 71,95 до 73,95 дюймів
- Від 73,95 до 75,95 дюймів
У цьому зразку є п'ять гравців, висота яких потрапляє в інтервал 59,95—61,95 дюймів, три гравці, висота яких припадає в інтервал 61,95—63,95 дюймів, 15 гравців, висота яких падає в інтервалі 63,95—65,95 дюймів, 40 гравців, чиї висоти потрапляють в інтервал 65,95—67,95 дюймів, 17 гравців, чиї висоти потрапляють в інтервал 67,95—69,95 дюймів, 12 гравців, висота яких припадає в інтервал 69,95—71,95, сім гравців, чиї висоти потрапляють в інтервал 71,95—73,95, і один гравця, висота якого потрапляє в інтервал 73,95—75,95. Всі висоти падають між кінцевими точками інтервалу, а не в кінцевих точках.
Приклад1.3.14
З таблиці1.3.8 знайдіть відсоток висот, які менше 65.95 дюймів.
Вправа1.3.14
Таблиця1.3.9 показує кількість річних опадів у вибірці міст у дюймах.
\ (\ Індекс сторінки {9}\) «>Кількість опадів (дюйми) | Частота | відносна частота | Накопичувальна відносна частота |
---|---|---|---|
2,95—4,97 | 6 | 650= 0,12 | 0,12 |
4,97—6,99 | 7 | 750= 0,14 | 0.12 + 0.14 = 0.26 |
6.99—9.01 | 15 | 1550= 0,30 | 0.26 + 0,30 = 0.56 |
9.01—11.03 | 8 | 850= 0,16 | 0.56 + 0,16 = 0.72 |
11.03—13.05 | 9 | 950= 0,18 | 0.72 + 0,18 = 0.90 |
31.05—15.07 | 5 | 550= 0,10 | 0,90 + 0,10 = 1,00 |
Всього = 50 | Всього = 1,00 |
З таблиці1.3.9 знайдіть відсоток опадів, який менше 9,01 дюймів.
Приклад1.3.15
З таблиці1.3.8 знайдіть відсоток висот, які падають між 61,95 і 65,95 дюймів.
- Відповідь
-
Рішення 1.15
Додайте відносні частоти в другому і третьому рядах:0.03+0.15=0.18 або 18%.
Вправа1.3.15
З таблиці1.3.9 знайдіть відсоток опадів, який становить від 6,99 до 13,05 дюймів.
Приклад1.3.16
Використовуйте висоти 100 чоловічих напівпрофесійних футболістів у табл1.3.8. Заповніть пропуски і перевірте свої відповіді.
- Відсоток висот від 67,95 до 71,95 дюйма становить: ____.
- Відсоток висот від 67,95 до 73,95 дюймів становить: ____.
- Відсоток висот, що перевищує 65,95 дюймів, становить: ____.
- Кількість гравців у вибірці, які мають висоту від 61,95 до 71,95 дюйма, становить: ____.
- Які дані є висотами?
- Опишіть, як ви могли б зібрати ці дані (висоти) так, щоб дані були характерні для всіх чоловіків-напівпрофесійних футболістів.
Пам'ятайте, ви підраховуєте частоти. Щоб знайти відносну частоту, розділіть частоту на загальну кількість значень даних. Щоб знайти кумулятивну відносну частоту, додайте всі попередні відносні частоти до відносної частоти для поточного ряду.
- Відповідь
-
Рішення 1.16
- 29%
- 36%
- 77%
- 87
- кількісний безперервний
- отримати списки від кожної команди і вибрати простий випадковий зразок з кожної
Приклад1.3.17
Дев'ятнадцять людей запитували, скільки миль, до найближчої милі, вони щодня їздять на роботу. Дані такі: 2; 5; 7; 3; 2; 10; 18; 15; 20; 7; 10; 18; 5; 12; 13; 12; 4; 5; 10. Таблиця1.3.10 була виготовлена:
\ (\ pageIndex {10}\) Частота поїздок відстаней «>Дані | Частота | відносна частота | Накопичувальна відносна частота |
---|---|---|---|
3 | 3 | 319 | 0,1579 |
4 | 1 | 119 | 0,2105 |
5 | 3 | 319 | 0,1579 |
7 | 2 | 219 | 0,2632 |
10 | 3 | 419 | 0,4737 |
12 | 2 | 219 | 0,7895 |
13 | 1 | 119 | 0.8421 |
15 | 1 | 119 | 0.8948 |
18 | 1 | 119 | 0,9474 |
20 | 1 | 119 | 1.0000 |
- Чи правильно таблиця? Якщо це не правильно, що не так?
- Правда чи брехня: Три відсотки опитаних людей їздять на три милі. Якщо твердження невірне, яким воно повинно бути? Якщо таблиця невірна, внесіть виправлення.
- Яка частка опитаних людей їздить на п'ять або сім миль?
- Яка частка опитаних людей їздить на 12 миль або більше? Менше 12 миль? Між п'ятьма і 13 милями (не включаючи п'ять і 13 миль)?
- Відповідь
-
Рішення 1.17
- Ні. Колонка частот становить 18, а не 19. Не всі кумулятивні відносні частоти є правильними.
- Помилкові. Частота на три милі повинна бути одна; для двох миль (залишилася) - дві. Сукупний стовпчик відносної частоти повинен читати: 0,1052, 0,1579, 0,2105, 0,3684, 0,4737, 0.6316, 0,7368, 0,7895, 0.8421, 0.9474, 1.0000.
- 519
- \frac{7}{19}, \frac{12}{19}, \frac{7}{19)
Вправа1.3.17
Таблиця1.3.9 представляє кількість річних опадів у вибірці міст у дюймах. Яка частка опитаних міст отримує від 11.03 до 13.05 дюймів опадів щороку?
Приклад1.3.18
Таблиця1.3.11 містить загальну кількість загиблих у всьому світі внаслідок землетрусів за період з 2000 по 2012 рік.
\ (\ Індекс сторінки {11}\) «>Рік | Загальна кількість загиблих |
---|---|
2000 | 231 |
2001 | 21 357 |
2002 | 11 685 |
2003 | 33 819 |
2004 | 228 802 |
2005 | 88 003 |
2006 | 6 605 |
2007 | 712 |
2008 | 88 011 |
2009 | 1 790 |
2010 | 320 120 |
2011 | 21 953 |
2012 | 768 |
Всього | 823 856 |
Дайте відповідь на наступні питання.
- Яка частота смертей вимірюється з 2006 по 2009 рік?
- Який відсоток смертей стався після 2009 року?
- Яка відносна частота смертей, що сталися в 2003 році або раніше?
- Який відсоток смертей, які сталися в 2004 році?
- Якими даними є цифри смертей?
- Шкала Ріхтера використовується для кількісної оцінки енергії, виробленої землетрусом. Прикладами чисел шкали Ріхтера є 2.3, 4.0, 6.1 та 7.0. Що це за дані ці цифри?
- Відповідь
-
Рішення 1.18
- 97 118 (11,8%)
- 41,6%
- 67,092/823,356 або 0,081 або 8,1%
- 27,8%
- Кількісний дискретний
- Кількісний безперервний
Вправа1.3.18
Таблиця1.3.12 містить загальну кількість смертельних автотранспортних аварій в США за період з 1994 по 2011 рік.
\ (\ Індекс сторінки {12}\) «>Рік | Загальна кількість аварій | Рік | Загальна кількість аварій |
---|---|---|---|
1994 | 36 254 | 2004 | 38 444 |
1995 | 37 241 | 2005 | 39 252 |
1996 | 37 494 | 2006 | 38 648 |
1997 | 37 324 | 2007 | 37 435 |
1998 | 37 107 | 2008 | 34 172 |
1999 | 37 140 | 2009 | 30 862 |
2000 | 37 526 | 2010 | 30 296 |
2001 | 37 862 | 2011 | 29 757 |
2002 | 38 491 | Всього | 653 782 |
2003 | 38 477 |
Дайте відповідь на наступні питання.
- Яка частота смертей вимірюється з 2000 по 2004 рік?
- Який відсоток смертей стався після 2006?
- Яка відносна частота смертей, що сталися в 2000 році або раніше?
- Який відсоток смертей, які сталися в 2011 році?
- Яка сукупна відносна частота за 2006 рік? Поясніть, що це число говорить вам про дані.