9: Статистика, опис даних
- Page ID
- 66278
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)
- 9.1: Графічне представлення категоріальних даних
- Категоричні, або якісні, дані - це фрагменти інформації, які дозволяють класифікувати досліджувані об'єкти за різними категоріями. Ми зазвичай починаємо роботу з категоріальними даними, узагальнюючи дані в частотну таблицю. Таблиця частот - це таблиця з двома стовпцями. В одному стовпці наведено категорії, а в іншому - частоти, з якими зустрічаються елементи в категоріях (скільки елементів вписується в кожну категорію).
- 9.2: Графічне представлення кількісних даних
- Кількісні, або числові, дані також можуть бути узагальнені в частотні таблиці. Гістограма - це графічне зображення кількісних даних. Горизонтальна вісь є числовою лінією. на гістограмі смужка представляє значення на горизонтальній осі від того, що знаходиться на лівій стороні смуги до, але не включаючи, значення в правій частині смуги. Деякі люди вирішують, щоб бари починалися з 1/2 значень, щоб уникнути цієї неоднозначності.
- 9.3: Заходи центральної тенденції
- Почнемо з того, що спробуємо знайти найбільш «типове» значення набору даних. Зауважте, що ми просто використовували слово «типовий», хоча в багатьох випадках ви можете подумати про використання слова «середній». Ми повинні бути обережними зі словом «середній», оскільки воно означає різні речі для різних людей у різних контекстах. Одне з найпоширеніших вживань слова «середнє» - це те, що математики і статистики називають середнім арифметичним, або просто простим старим середнім словом для коротких.
- 9.4: Міри варіації
- Існує кілька способів вимірювання «поширення» набору даних. Перший є найпростішим і називається діапазоном. Діапазон - це різниця між максимальним значенням і мінімальним значенням набору даних. Більш складна міра варіації називається стандартним відхиленням. Стандартне відхилення - це міра варіації, заснована на вимірюванні відстані, яке кожне значення даних відхиляється або відрізняється від середнього.
- 9.5: Вправи
- Ця сторінка містить 17 завдань вправ, пов'язаних з матеріалом з глави 9.