1.3: Описова статистика
Цілі навчання
- Визначте «описову статистику»
- Розрізняють описову статистику та інференційну статистику
Описова статистика - це цифри, які використовуються для узагальнення та опису даних. Слово «дані» відноситься до інформації, яка була зібрана в результаті експерименту, опитування, історичної записи і т.д. (До речі, «дані» множини. Один фрагмент інформації називається «датум».) Якщо ми аналізуємо свідоцтва про народження, наприклад, описовою статистикою може бути відсоток сертифікатів, виданих у штаті Нью-Йорк, або середній вік матері. Будь-яке інше число, яке ми обираємо для обчислення, також вважається описовою статистикою для даних, з яких обчислюється статистика. Кілька описових статистичних даних часто використовуються одночасно, щоб дати повну картину даних.
Описова статистика є просто описовою. Вони не передбачають узагальнення поза наявними даними. Узагальнення з наших даних до іншого набору випадків - це бізнес інференційної статистики, яку ви будете вивчати в іншому розділі. Тут ми зосереджуємося на (просто) описовій статистиці. Деякі описові статистичні дані наведені в табл1.3.1. У таблиці наведені середні зарплати за різними професіями в США в1999. (Натисніть тут, щоб побачити, скільки заробляють люди з іншими професіями.)
Зарплата | Заняття |
---|---|
$112 760 | педіатри |
$106,130 | стоматологи |
$100 090 | ортопеди |
$76,140 | фізики |
$53,410 | архітекторів |
$49,720 | шкільні, клінічні та консультаційні психологи |
$47,910 | стюардеси |
$39,560 | вчителі початкової школи |
$38,710 | поліцейські |
$18,980 | флористичні дизайнери |
Описова статистика, подібна до цих, пропонує розуміння американського суспільства. Цікаво відзначити, наприклад, що ми платимо людям, які виховують наших дітей і які захищають наших громадян набагато менше, ніж ми платимо людям, які піклуються про наші ноги або зуби.
Для отримання більш описової статистики розгляньте таблицю,1.3.2 яка показує кількість незаміжніх чоловіків на100 незаміжніх жінок у районах метро США в1990. З цієї таблиці ми бачимо, що чоловіки перевищують кількість жінок найбільше у Джексонвіллі, штат Північна Кароліна, а жінок найбільше перевищує кількість чоловіків у Сарасоті, штат Флорида. Ви бачите, що описова статистика може бути корисною, якщо ми шукаємо партнера протилежної статі! (Ці дані надходять з Альманаху «Інформація Будь ласка».)
Міста з переважно чоловіками | Чоловіки на 100 жінок | Міста з переважно жінками | Чоловіки на 100 жінок |
---|---|---|---|
1. Джексонвілл, NC |
224
|
1. Сарасота, Флорида |
66
|
2. Кіллін-Темпл, TX |
123
|
2. Брейдентон, Флорида |
68
|
3. Фейетвілл, NC |
118
|
3. Алтуна, Пенсильванія |
69
|
4. Бразорія, TX |
117
|
4. Спрінгфілд, IL |
70
|
5. Лоутон, OK |
116
|
5. Джексонвілл, TN |
70
|
6. Державний коледж, Пенсильванія |
113
|
6. Гадсден, AL |
70
|
7. Кларксвілл-Хопкінсвілл, TN-KY |
113
|
7. Вілінг, WV |
70
|
8. Анкорідж, Аляска |
112
|
8. Чарлстон, WV |
71
|
9. Салінас-Сісайд-Монтерей, Каліфорнія |
112
|
9. Сент-Джозеф, MO |
71
|
10. Станція Брайан-Колледж, Техас |
111
|
10. Лінчбург, Вірджинія |
71
|
ПРИМІТКА: До неодружених належать ніколи не одружені, овдовілі та розлучені особи,15 років і старше.
Ці описові статистичні дані можуть змусити нас задуматися, чому цифри настільки розрізнені в цих містах. Одне потенційне пояснення, наприклад, щодо того, чому у Флориді більше жінок, ніж чоловіків, може включати той факт, що люди похилого віку, як правило, переїжджають до регіону Сарасота і що жінки, як правило, переживають чоловіків. Таким чином, в Сарасоті може жити більше жінок, ніж чоловіків. Однак при відсутності належних даних це лише спекуляції.
Ви, напевно, знаєте, що описова статистика займає центральне місце у світі спорту. Кожна спортивна подія виробляє численні статистичні дані, такі як відсоток стрільби гравців у баскетбольній команді. Для олімпійського марафону (пішохідний забіг у26.2 милі) ми володіємо даними, які охоплюють понад століття змагань. (Перша сучасна Олімпіада відбулася в м1896.) Таблиця1.3.3 показує виграшні часи як для чоловіків, так і для жінок (останнім було дозволено змагатися лише з тих пір1984).
Жінкам | |||
---|---|---|---|
Рік | Переможець | Країна | Час |
1984 | Джоан Бенуа | США | 2:24:52 |
1988 | Роза Мота | ПОР | 2:25:40 |
1992 | Валентина Єгорова | УТ | 2:32:41 |
1996 | Фатума Роба | ETH | 2:26:05 |
2000 | Наоко Такахасі | JPN | 2:23:14 |
2004 | Мізукі Ногучі | JPN | 2:26:20 |
Чоловіки | |||
Рік | Переможець | Країна | Час |
1896 | Спіридон Луї | ГРЕЙ | 2:58:50 |
1900 | Мішель Теато | ФРА | 2:59:45 |
1904 | Томас Хікс | США | 3:28:53 |
1906 | Біллі Шеррінг | МОЖЕ | 2:51:23 |
1908 | Джонні Хейс | США | 2:55:18 |
1912 | Кеннет Макартур | С. афр. | 2:36:54 |
1920 | Ханнес Колехмайнен | ПЛАВНИК | 2:32:35 |
1924 | Альбін Стенроос | ПЛАВНИК | 2:41:22 |
1928 | Бугра Ель Уафі | ФРА | 2:32:57 |
1932 | Хуан Карлос Забала | АРГ | 2:31:36 |
1936 | Сон Кі-Чунг | JPN | 2:29:19 |
1948 | Дельфо Кабрера | АРГ | 2:34:51 |
1952 | Еміль Зтопек | CZE | 2:23:03 |
1956 | Ален Мімун | ФРА | 2:25:00 |
1960 | Абебе — Бікіла | ETH | 2:15:16 |
1964 | Абебе — Бікіла | ETH | 2:12:11 |
1968 | Мамо Вульде | ETH | 2:20:26 |
1972 | Френк Коротше | США | 2:12:19 |
1976 | Вальдемар Черпінський | Е.Гер | 2:09:55 |
1980 | Вальдемар Черпінський | Е.Гер | 2:11:03 |
1984 | Карлос Лопес | ПОР | 2:09:21 |
1988 | Геліндо Бордін | ІТА | 2:10:32 |
1992 | Хван Янг-Чо | С. Кор | 2:13:23 |
1996 | Джося Тугване | С. афр. | 2:12:36 |
2000 | Гезахенге Абера | ETH | 2:10 .10 |
2004 | Стефано Бальдіні | ІТА | 2:10:55 |
Існує багато описової статистики, яку ми можемо обчислити за даними в таблиці. Щоб отримати уявлення про поліпшення швидкості протягом багатьох років, розділимо чоловічі часи на дві частини, а саме перші13 раси (до1952) і другі13 (починаючи з1956). Середній час виграшу для перших13 заїздів -2 години,44 хвилини та22 секунди (написано2:44:22). Середній час виграшу для другої13 гонки становить2:13:18. Це досить різниця (понад півгодини). Чи доводить це, що найшвидші чоловіки бігають швидше? Або різниця лише через випадковість, не більше, ніж те, що часто виникає з випадкових відмінностей у продуктивності з року в рік? Ми не можемо відповісти на це питання лише описовою статистикою. Все, що ми можемо стверджувати, це те, що два засоби є «сугестивними».
Вивчення таблиці 3 призводить до багатьох інших питань. Зауважимо, що Такахасі (провідна жінка-бігун2000) обіграв би чоловічого бігуна1956 та всіх бігунів чоловіків-чоловіків у перших12 марафоні. Цей факт змушує нас запитати, чи закриється гендерний розрив чи залишиться постійним. Коли ми дивимось на час кожної статі, ми також дивуємось, наскільки вони зменшаться (якщо взагалі) у наступному столітті Олімпіади. Чи можемо ми одного дня стати свідками2 субгодинного марафону? Вивчення статистики може допомогти вам зробити розумні здогадки про відповіді на ці питання.
- Міккі Хебль