11.5: Заходи центральної тенденції
- Page ID
- 66138
Почнемо з того, що спробуємо знайти найбільш «типове» значення набору даних.
Зауважте, що ми просто використовували слово «типовий», хоча в багатьох випадках ви можете подумати про використання слова «середній». Ми повинні бути обережними зі словом «середній», оскільки воно означає різні речі для різних людей у різних контекстах. Одне з найпоширеніших вживань слова «середнє» - це те, що математики і статистики називають середнім арифметичним, або просто простим старим середнім словом для коротких. «Середнє арифметичне» звучить досить фантазії, але ви, ймовірно, багато разів обчислювали середнє значення, не усвідомлюючи цього; середнє - це те, про що думають більшість людей, коли вживають слово «середній».
Середнє значення набору даних - це сума значень даних, поділена на кількість значень.
Оцінки іспиту Марсі для її останнього класу з математики склали: 79, 86, 82, 94. Середнє значення цих значень буде:
Рішення
\[\frac{79+86+82+94}{4}=85.25. \nonumber \]
Як правило, ми округляємо означає на один десятковий розряд більше, ніж вихідні дані мали. У цьому випадку ми будемо округлити 85.25 до 85.3.
Кількість тачдаун (TD) паси кинуті кожною з 31 команд у Національній футбольній лізі в 2000 сезон показані нижче.
37 33 33 32 29 28 28 23 22 22 21 21 21 20
20 19 19 18 18 18 18 16 15 14 14 12 12 9 6
Рішення
Додавши ці значення, ми отримуємо 634 загальних TD. Діливши на 31, кількість значень даних, отримаємо\(\frac{634}{31} = 20.4516\). Було б доречно округлити це до 20.5.
Було б найбільш правильним для нас повідомити, що «Середня кількість тачдаунів, кинутих в НФЛ у сезоні 2000, становила 20.5 проходи», але не рідкість бачити більш випадкове слово «середній», що використовується замість «середнє».
Ціна банки арахісового масла в 5 магазинах становила: $3,29, $3,59, $3,79, $3,75 і $3,99. Знайдіть середню ціну.
- Відповідь
-
Додайте сюди тексти. Не видаляйте цей текст спочатку.
Сто сімей в конкретному районі просять їх річний дохід домогосподарств, до найближчих $5 тисяч доларів. Результати зведені в таблиці частот нижче.
\ (\ почати {масив} {|l|l|}
\ hline\ textbf {Дохід (тисячі доларів)} &\ textbf {Частота}
\\ hline 15 & 6
\\ hline 20 & 8\
\\ hline 25 & 11\\
\ hline 30 & 17\\
\ hline 35 & 19\\
\ hline 40 & 20\\
\ hline 45 & 12\\
\ hline 50 & 7\\
\ hline\
\ кінець {масив}\)
Рішення
Обчислення середнього вручну може стати складним, якщо ми спробуємо ввести всі 100 значень:
\[\frac{15 + \cdots + 15 + 20 + \cdots+20 + 25 + \cdots + 25 + \cdots}{100} \nonumber \]
Ми могли б обчислити це легше, помітивши, що додавання 15 до себе шість разів - це те саме, що і\(15 \cdot 6=90\). Використовуючи це спрощення, отримаємо
\[\frac{15 \cdot 6+20 \cdot 8+25 \cdot 11+30 \cdot 17+35 \cdot 19+40 \cdot 20+45 \cdot 12+50 \cdot 7}{100}=\frac{3390}{100}=33.9 \nonumber \]
Середній дохід домогосподарств нашої вибірки становить 33,9 тис. Доларів (33 900 доларів).
Продовжуючи останній приклад, припустимо, що нова сім'я переїжджає в приклад сусідства, який має дохід домогосподарств у розмірі 5 мільйонів доларів (5000 тисяч доларів). Додавши це до нашого зразка, наше середнє значення тепер:
Рішення
\[\frac{15 \cdot 6+20 \cdot 8+25 \cdot 11+30 \cdot 17+35 \cdot 19+40 \cdot 20+45 \cdot 12+50 \cdot 7+5000 \cdot 1}{101}=\frac{8390}{101}=83.069 \nonumber \]
Хоча 83,1 тисячі доларів ($83 069) є правильним середнім доходом домогосподарств, він більше не представляє «типового» значення.
Уявіть значення даних за шкалою пилки або балансу. Середнє значення - це значення, яке утримує дані в балансі, як на малюнку нижче.
Якщо ми графуємо дані наших домогосподарств, значення даних у розмірі 5 мільйонів доларів настільки далеко праворуч, що середнє значення має коригувати, щоб зберегти речі в рівновазі
З цієї причини при роботі з даними, які мають викиди - значення далеко за межами первинного групування - зазвичай використовується інша міра центру, медіана.
Щоб знайти медіану, почніть з перерахування даних в порядку від найменшого до найбільшого або найбільшого до найменшого.
Якщо кількість значень даних,\(N\), непарна, то медіана - середнє значення даних. Це значення можна знайти шляхом округлення\(\frac{N}{2}\) до наступного цілого числа.
Якщо кількість значень даних парне, то немає одного середнього значення, тому знаходимо середнє значення двох середніх значень (значення\(\frac{N}{2}\) і\(\frac{N}{2} + 1\))
Повертаючись до даних про приземлення футболу, ми почнемо з перерахування даних по порядку. На щастя, це вже було в порядку зменшення, тому ми можемо працювати з ним, не потребуючи спочатку його упорядкування.
37 33 33 32 29 28 28 23 22 22 21 21 21 20
20 19 19 18 18 18 18 16 15 14 14 12 12 9 6
Рішення
Оскільки існує 31 значення даних, непарне число, медіаною буде середнє число, 16-е значення даних (\ frac {31} {2} = 15,5\), округляємо до 16, залишивши 15 значень нижче і 15 вище). 16-е значення даних становить 20, тому медіана кількість тачдаунів у сезоні 2000 року становила 20 проходів. Зверніть увагу, що для цих даних медіана досить близька до середнього, яке ми розрахували раніше, 20.5.
Знайдіть медіану цих балів вікторини: 5 10 8 6 4 8 2 5 7
Ми починаємо з перерахування даних по порядку: 2 4 5 5 6 7 7 8 8 10
Рішення
Так як існує 10 значень даних, парне число, то немає одного середнього числа. Таким чином, ми знаходимо середнє з двох середніх чисел, 6 і 7, і отримати\(\frac{6+7}{2} = 6.5\).
Медіана оцінка вікторини склала 6,5.
Ціна банки арахісового масла в 5 магазинах становила: $3,29, $3,59, $3,79, $3,75 і $3,99. Знайдіть медіану ціну.
- Відповідь
-
Спочатку ми розміщуємо дані в порядку: $3,29, $3,59, $3,75, $3,79, $3,99. Оскільки існує непарна кількість даних, медіаною буде середнє значення, $3.75.
Повернемося тепер до наших вихідних даних про доходи домогосподарств
\ (\ почати {масив} {|l|l|}
\ hline\ textbf {Дохід (тисячі доларів)} &\ textbf {Частота}
\\ hline 15 & 6
\\ hline 20 & 8\
\\ hline 25 & 11\\
\ hline 30 & 17\\
\ hline 35 & 19\\
\ hline 40 & 20\\
\ hline 45 & 12\\
\ hline 50 & 7\\
\ hline\
\ кінець {масив}\)
Рішення
Тут ми маємо 100 значень даних. Якби ми цього ще не знали, ми могли б знайти це, додавши частоти. Оскільки 100 - парне число, нам потрібно знайти середнє значення двох середніх значень даних - 50-го і 51-го значень даних. Щоб знайти їх, ми починаємо відлік знизу:
\[\begin{array}{ll} \text{There are 6 data values of \$15, so} & \text{Values 1 to } 6 \text{ are \$15 thousand } \\ \text{The next 8 data values are \$20, so } & \text{Values 7 to } (6+8)=14 \text{ are \$20 thousand} \\ \text{The next 11 data values are \$25, so} & \text{ Values 15 to } (14+11)=25 \text{ are \$25 thousand} \\ \text{The next 17 data values are \$30, so} & \text{Values 26 to } (25+17)=42 \text{ are \$30 thousand} \\ \text{The next 19 data values are \$35, so} & \text{Values 43 to } (42+19)=61 \text{ are \$35 thousand} \end{array} \nonumber \]
З цього можна сказати, що значення 50 і 51 складуть $35 тис., А середнє значення цих двох значень - $35 тис. Середній дохід в цьому районі становить $35 тис.
Якщо додати в нового сусіда з доходом домогосподарства в 5 мільйонів доларів, то буде 101 значення даних, а 51-е значення буде медіаною. Як ми виявили в останньому прикладі, 51-е значення становить $35 тис. Зверніть увагу, що новий сусід не вплинув на медіану в даному випадку. Медіана не коливається так сильно викидами, як середнє.
Крім середнього і медіани, існує ще одне загальне вимірювання «типового» значення набору даних: режим.
Режим - це елемент набору даних, який зустрічається найчастіше.
Режим є досить марним з даними, такими як ваги або висоти, де є велика кількість можливих значень. Режим найчастіше використовується для категоріальних даних, для яких медіана і середнє значення не можуть бути обчислені.
У нашому опитуванні кольорів автомобіля ми зібрали дані
\ (\ почати {масив} {|l|l|}
\ hline\ textbf {Колір} &\ textbf {Частота}
\\ hline\ текст {Синій} & 3
\\ hline\ текст {зелений} & 5
\\ hline\ текст {червоний} & 4
\\ hline\ текст {білий} & 3\
\ hline\ текст {Чорний} & 2\
\ hline\ текст {сірий} & 3\\ hline
\ end {масив}\)
Для цих даних Green - це режим, оскільки саме значення даних траплялося найчастіше.
Можна, щоб набір даних мав більше одного режиму, якщо кілька категорій мають однакову частоту, або немає режимів, якщо кожна категорія зустрічається лише один раз.
Рецензентам було запропоновано оцінити продукт за шкалою від 1 до 5. Знайти
- Середній рейтинг
- Медіана рейтингу
- Рейтинг режиму
\ (\ почати {масив} {|l|l|}
\ hline\ textbf {Рейтинг} &\ textbf {Частота}
\\ hline 1 & 4
\\\ hline 2 & 8
\\\ hline 3\\
\ hline 4 & 3\\
\ hline 5 & 1\\
\ hline
\ кінець { масив}\)
- Відповідь
-
- Середнє значення є\(\frac{1 \cdot 4+2 \cdot 8+3 \cdot 7+4 \cdot 3+5 \cdot 1}{23} \approx 2.5\)
- Є 23 значення даних, тому медіана буде 12-м значенням даних. Оцінки 1 - це перші 4 значення, тоді як рейтинг 2 - наступні 8 значень, тому 12-е значення буде оцінкою 2. Медіана дорівнює 2.
- Режим - найчастіший рейтинг. Рейтинг режиму - 2.