Skip to main content
LibreTexts - Ukrayinska

1.3: Середнє, дисперсія та стандартне відхилення

  • Page ID
    76869
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Що мається на увазі під середнім або середнім значенням кількості? Припустимо, що ми хочемо розрахувати середній вік магістрантів Техаського університету в Остіні. Ми могли б піти в будівлю центральної адміністрації і дізнатися, скільки вісімнадцять років, дев'ятнадцять років, і так далі, в даний час були зараховані. Потім ми б написати щось на\(N_{18}\) кшталт\[{\rm Average~Age} \simeq \frac{N_{18}\times 18 + N_{19}\times 19 +N_{20} \times 20+\cdots} {N_{18}+N_{19}+N_{20}+\cdots},\] де число зарахованих вісімнадцять річних, і так далі. Імовірність того, що випадковим чином обраний студент вісімнадцять\(N_{\rm students}=N_{18}+N_{19}+N_{20}+\cdots\) є\[P_{18} \simeq \frac{N_{18}}{N_{\rm students}},\] де загальна кількість зарахованих студентів. (Власне, це визначення є точним лише в тій межі, яка\(N_{\rm students}\) дуже велика.) Тепер ми бачимо, що середній вік приймає форму\[{\rm Average~Age} \simeq P_{18}\times 18 + P_{19}\times 19 + P_{20}\times 20 +\cdots.\] Нарешті, тому що немає нічого унікального щодо вікового розподілу студентів в UT Austin, для загальної змінної\(u\), яка може приймати будь-який з\(M\) можливих значень\(u_1\)\(u_2, \cdots, u_M\), з відповідними ймовірностями \(P(u_1)\),\(P(u_2),\cdots, P(u_M)\), Визначається середнє або середнє значення\(\langle u\rangle\), яке позначається\(u\) \[\label{dmean} \langle u\rangle \equiv \sum_{i=1,M} P(u_i)\, u_i.\]

    Припустимо, що\(f(u)\) це якась функція\(u\). Таким чином, для кожного з\(M\) можливих значень\(u\), існує відповідне значення,\(f(u)\) яке відбувається з однаковою ймовірністю. Тобто\(f(u_1)\) відповідає\(u_1\), і відбувається з ймовірністю\(P(u_1)\) і так далі. З нашого попереднього визначення випливає, що середнє значення\(f(u)\) задається\[\langle f(u)\rangle \equiv \sum_{i=1,M} P(u_i)\, f(u_i).\] Припустимо, що\(f(u)\) і\(g(u)\) є двома загальними функціями\(u\). Звідси випливає, що\[\langle f(u)+g(u)\rangle = \sum_{i=1,M}P(u_i)\,[f(u_i)+g(u_i)] = \sum_{i=1,M}P(u_i)\,f(u_i)+ \sum_{i=1,M} P(u_i)\,g(u_i),\] так\[\langle f(u)+g(u)\rangle= \langle f(u)\rangle+\langle g(u)\rangle.\] Нарешті, якщо\(c\) є загальною константою, то зрозуміло, що\[\langle c \,f(u)\rangle = c\,\langle f(u)\rangle.\]

    Тепер ми знаємо, як визначити середнє значення загальної змінної,\(u\). Розглянемо, як ми могли б охарактеризувати розкид навколо середнього значення. Ми могли б дослідити відхилення\(u\) від його середнього значення\(\langle u\rangle\), яке позначається\[{\mit\Delta} u \equiv u- \langle u\rangle.\] Насправді це не особливо цікава величина, оскільки її середнє значення очевидно дорівнює нулю: тобто\[\langle {\mit\Delta} u\rangle = \left\langle(u-\langle u\rangle)\right\rangle = \langle u\rangle-\langle u\rangle = 0.\] це ще один спосіб сказати, що середнє відхилення від середнього зникає. Більш цікава величина - квадрат відхилення. Середнє значення цієї величини, \[\label{dvar} \left\langle ({\mit\Delta} u)^2\right\rangle = \sum_{i=1,M} P(u_i)\,(u_i - \langle u\rangle)^2,\]прийнято називати дисперсією. Дисперсія є додатним дійсним числом, якщо немає розкиду взагалі в розподілі, так що всі можливі значення\(u\) відповідають середньому значенню\(\langle u\rangle\), і в цьому випадку вона приймає значення нуль. Зверніть увагу на те,\[\left \langle (u-\langle u\rangle )^2\right\rangle = \left\langle( u^{\,2}-2\,u\,\langle u\rangle+\langle u\rangle^{\,2})\right\rangle= \left\langle u^{\,2}\right\rangle-2\,\langle u\rangle\,\langle u\rangle+\langle u\rangle^{\,2},\] що дає наступне корисне співвідношення\[\left\langle({\mit\Delta} u)^2\right\rangle= \left\langle u^{\,2}\right\rangle-\langle u\rangle^2.\] дисперсія\(u\) пропорційна квадрату розкиду\(u\) навколо його середнього значення. Більш корисну міру розкиду дає квадратний корінь дисперсії,\[\sigma_u = \left[\,\left\langle({\mit\Delta} u)^2\right\rangle\,\right]^{1/2},\] яку прийнято називати стандартним відхиленням\(u\). Стандартне відхилення - це, по суті, ширина діапазону, по якому\(u\) розподіляється навколо його середнього значення,\(\langle u\rangle\).

    Дописувачі та атрибуція