Skip to main content
LibreTexts - Ukrayinska

2: Описова статистика

  • Page ID
    98406
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    У цьому розділі ви вивчите числові та графічні способи опису та відображення ваших даних. Ця область статистики називається «Описова статистика». Ви дізнаєтеся, як обчислювати, а ще важливіше, як інтерпретувати ці вимірювання і графіки.

    • 2.1: Прелюдія до описової статистики
      У цьому розділі ви вивчите числові та графічні способи опису та відображення ваших даних. Ця область статистики називається «Описова статистика». Ви дізнаєтеся, як розраховувати, а ще важливіше, як інтерпретувати ці вимірювання і графіки. У цьому розділі ми коротко розглянемо діаграми стебла та листя, лінійні графіки та гістограми, а також частотні полігони та графіки часових рядів. Наш акцент буде зроблений на гістограмах і графіках коробки.
    • 2.2: Графіки стовбурових і листових (Stemplots), лінійні графіки та гістограми
      Графік зі стебла та листа - це спосіб побудови даних та перегляду розподілу, де видно всі значення даних у класі. Перевага в графіку стебла і листа полягає в тому, що всі значення перераховані, на відміну від гістограми, яка дає класи значень даних. Лінійний графік часто використовується для представлення набору значень даних, в яких кількість змінюється з часом. Ці графіки корисні для пошуку тенденцій. Гістограма - це діаграма, яка використовує горизонтальні або вертикальні смуги для показу порівнянь між категоріями.
    • 2.3: Гістограми, частотні багатокутники та графіки часових рядів
      Гістограма - це графічна версія частотного розподілу. Графік складається з стовпчиків однакової ширини, намальованих поруч один з одним. Горизонтальна шкала представляє класи кількісних значень даних, а вертикальна шкала - частоти. Висоти штанг відповідають значенням частоти. Гістограми зазвичай використовуються для великих, безперервних, кількісних наборів даних. Частотний багатокутник також може бути використаний при графіках великих наборів даних з точками даних, які повторюються.
    • 2.4: Заходи розташування даних
      Значення, які ділять впорядкований рангом набір даних на 100 рівних частин, називаються процентилями і використовуються для порівняння та інтерпретації даних. Наприклад, спостереження на 50-му процентилі було б більше 50% інших спостережень у наборі. Квартили ділять дані на чверті. Перший квартиль - 25-й процентиль, другий квартиль - 50-й процентиль, а третій квартиль - 75-й процентиль. Інтерквартильний діапазон - це діапазон середніх 50% значень даних
    • 2.5: Коробкові сюжети
      Графіки коробки - це тип графіка, який може допомогти візуально організувати дані. Для побудови графіка квадратного графіка необхідно обчислити наступні точки даних: мінімальне значення, перший квартиль, медіана, третій квартиль та максимальне значення. Після того, як графічний графік коробки, ви можете відображати та порівнювати розподіли даних.
    • 2.6: Заходи Центру даних
      Середнє значення та медіана можуть бути розраховані, щоб допомогти вам знайти «центр» набору даних. Середнє значення є найкращою оцінкою для фактичного набору даних, але медіана є найкращим вимірюванням, коли набір даних містить кілька викидів або екстремальних значень. Режим покаже вам найбільш часто зустрічаються дані (або дані) у вашому наборі даних. Середнє значення, медіана та режим надзвичайно корисні, коли вам потрібно проаналізувати свої дані.
    • 2.7: Схил та середнє, середнє та режим
      Дивлячись на розподіл даних, можна багато чого виявити про зв'язок між середнім, медіаною та режимом. Існує три типи дистрибутивів. Правий (або позитивний) перекіс розподілу, лівий (або негативний) перекіс розподілу і симетричний розподіл.
    • 2.8: Заходи поширення даних
      Важливою характеристикою будь-якого набору даних є варіація даних. У деяких наборах даних значення даних зосереджені близько до середнього; в інших наборах даних значення даних більш поширені від середнього. Найпоширенішою мірою варіації, або спреду, є стандартне відхилення. Стандартне відхилення - це число, яке вимірює, наскільки далекі значення даних від їх середнього.
    • 2.9: Описова статистика (робочий аркуш)
      Статистика Робочий аркуш: Студент побудує гістограму та графік коробки. Учень розрахує однозначну статистику. Студент вивчить графіки, щоб інтерпретувати, що означають дані.
    • 2.E: Описова статистика (вправи)
      Це домашні вправи для супроводу TextMap, створеного для «Вступної статистики» OpenStax.