2: Описова статистика
- Page ID
- 98406
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)
У цьому розділі ви вивчите числові та графічні способи опису та відображення ваших даних. Ця область статистики називається «Описова статистика». Ви дізнаєтеся, як обчислювати, а ще важливіше, як інтерпретувати ці вимірювання і графіки.
- 2.1: Прелюдія до описової статистики
- У цьому розділі ви вивчите числові та графічні способи опису та відображення ваших даних. Ця область статистики називається «Описова статистика». Ви дізнаєтеся, як розраховувати, а ще важливіше, як інтерпретувати ці вимірювання і графіки. У цьому розділі ми коротко розглянемо діаграми стебла та листя, лінійні графіки та гістограми, а також частотні полігони та графіки часових рядів. Наш акцент буде зроблений на гістограмах і графіках коробки.
- 2.2: Графіки стовбурових і листових (Stemplots), лінійні графіки та гістограми
- Графік зі стебла та листа - це спосіб побудови даних та перегляду розподілу, де видно всі значення даних у класі. Перевага в графіку стебла і листа полягає в тому, що всі значення перераховані, на відміну від гістограми, яка дає класи значень даних. Лінійний графік часто використовується для представлення набору значень даних, в яких кількість змінюється з часом. Ці графіки корисні для пошуку тенденцій. Гістограма - це діаграма, яка використовує горизонтальні або вертикальні смуги для показу порівнянь між категоріями.
- 2.3: Гістограми, частотні багатокутники та графіки часових рядів
- Гістограма - це графічна версія частотного розподілу. Графік складається з стовпчиків однакової ширини, намальованих поруч один з одним. Горизонтальна шкала представляє класи кількісних значень даних, а вертикальна шкала - частоти. Висоти штанг відповідають значенням частоти. Гістограми зазвичай використовуються для великих, безперервних, кількісних наборів даних. Частотний багатокутник також може бути використаний при графіках великих наборів даних з точками даних, які повторюються.
- 2.4: Заходи розташування даних
- Значення, які ділять впорядкований рангом набір даних на 100 рівних частин, називаються процентилями і використовуються для порівняння та інтерпретації даних. Наприклад, спостереження на 50-му процентилі було б більше 50% інших спостережень у наборі. Квартили ділять дані на чверті. Перший квартиль - 25-й процентиль, другий квартиль - 50-й процентиль, а третій квартиль - 75-й процентиль. Інтерквартильний діапазон - це діапазон середніх 50% значень даних
- 2.5: Коробкові сюжети
- Графіки коробки - це тип графіка, який може допомогти візуально організувати дані. Для побудови графіка квадратного графіка необхідно обчислити наступні точки даних: мінімальне значення, перший квартиль, медіана, третій квартиль та максимальне значення. Після того, як графічний графік коробки, ви можете відображати та порівнювати розподіли даних.
- 2.6: Заходи Центру даних
- Середнє значення та медіана можуть бути розраховані, щоб допомогти вам знайти «центр» набору даних. Середнє значення є найкращою оцінкою для фактичного набору даних, але медіана є найкращим вимірюванням, коли набір даних містить кілька викидів або екстремальних значень. Режим покаже вам найбільш часто зустрічаються дані (або дані) у вашому наборі даних. Середнє значення, медіана та режим надзвичайно корисні, коли вам потрібно проаналізувати свої дані.
- 2.7: Схил та середнє, середнє та режим
- Дивлячись на розподіл даних, можна багато чого виявити про зв'язок між середнім, медіаною та режимом. Існує три типи дистрибутивів. Правий (або позитивний) перекіс розподілу, лівий (або негативний) перекіс розподілу і симетричний розподіл.
- 2.8: Заходи поширення даних
- Важливою характеристикою будь-якого набору даних є варіація даних. У деяких наборах даних значення даних зосереджені близько до середнього; в інших наборах даних значення даних більш поширені від середнього. Найпоширенішою мірою варіації, або спреду, є стандартне відхилення. Стандартне відхилення - це число, яке вимірює, наскільки далекі значення даних від їх середнього.
- 2.9: Описова статистика (робочий аркуш)
- Статистика Робочий аркуш: Студент побудує гістограму та графік коробки. Учень розрахує однозначну статистику. Студент вивчить графіки, щоб інтерпретувати, що означають дані.
- 2.E: Описова статистика (вправи)
- Це домашні вправи для супроводу TextMap, створеного для «Вступної статистики» OpenStax.