2: Описова статистика
- Page ID
- 97763
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)
Статистика природно ділиться на дві гілки, описову статистику та статистику висновків. Наш основний інтерес полягає у статистиці висновків, щоб спробувати зробити висновок з даних, що населення може схуднути, або оцінити ймовірність того, що спостерігається різниця між групами є надійною або такою, яка могла статися випадково в цьому дослідженні. Тим не менш, відправною точкою для роботи зі збором даних є їх ефективне впорядкування, відображення та узагальнення. Це цілі описової статистики, тема цієї глави.
- 2.1: Три популярних дисплеї даних
- Графічні зображення великих наборів даних забезпечують швидкий огляд характеру даних. Популяція або дуже великий набір даних може бути представлений плавною кривою. Ця крива є дуже тонкою гістограмою відносної частоти, в якій надзвичайно вузькі вертикальні смуги були опущені. Коли крива, отримана з гістограми відносної частоти, використовується для опису набору даних, частка даних зі значеннями між двома числами a та b - це площа під кривою між a та b, оскільки
- 2.2: Міри центрального розташування - три види середніх
- Середнє значення, медіана і режим кожен відповідають на питання «Де центр набору даних?» Характер набору даних, на який вказує гістограма відносної частоти, визначає, який з них дає найкращу відповідь.
- 2.3: Міри мінливості
- Діапазон, стандартне відхилення та дисперсія дають кількісну відповідь на питання «Наскільки змінними є дані?»
- 2.4: Відносне положення даних
- Перцентильний ранг та z-оцінка вимірювання вказують на його відносне положення щодо інших вимірювань у наборі даних. Три квартилі ділять набір даних на четверті. Підсумок з п'яти чисел та пов'язаний з ним графік коробки підсумовують розташування та розподіл даних.
- 2.5: Емпіричне правило і теорема Чебишева
- Емпіричне правило - це наближення, яке застосовується лише до наборів даних з гістограмою відносної частоти у формі дзвону. Він оцінює частку вимірювань, які лежать в межах одного, двох і трьох стандартних відхилень середнього. Теорема Чебишева - це факт, який застосовується до всіх можливих наборів даних. Він описує мінімальну частку вимірювань, які повинні лежати в межах одного, двох або більше стандартних відхилень від середнього.
- 2.E: Описова статистика (вправи)
- Це домашні вправи для супроводу TextMap, створеного для «Вступної статистики» Шафер та Чжан. Додаткові загальні банки питань хімії можна знайти для інших Textmaps і можуть бути доступні тут. На додаток до цих загальнодоступних питань, доступ до приватного банку проблем для використання в іспитах та домашніх завданнях доступний викладачам лише в індивідуальному порядку; будь ласка, зв'яжіться з Delmar Larsen для облікового запису з дозволом на доступ.