1.10: Дистрибутиви
Цілі навчання
- Визначте «розподіл»
- Інтерпретувати розподіл частот
- Розрізняють розподіл частот і розподіл ймовірностей
- Побудувати згрупований розподіл частот для неперервної змінної
- Визначте перекіс розподілу
- Визначте бімодальні, лептокуртіческіе та плетикуртіческіе розподіли
Розподіли дискретних змінних
Нещодавно придбаний мішок Plain M&M's містив цукерки шести різних кольорів. Швидкий підрахунок показав, що існують55 M&M:17 коричневий,18 червоний,7 жовтий,7 зелений,2 синій та4 помаранчевий. Ці підрахунки наведені нижче в табл1.10.1.
Колір | Частота |
---|---|
Коричневий | 17 |
Червоний | 18 |
Жовтий | 7 |
Зелений | 7 |
Синій | 2 |
Помаранчевий | 4 |
Ця таблиця називається таблицею частот і описує розподіл колірних частот M&M. Не дивно, що такий вид розподілу називається частотним розподілом. Часто частотний розподіл показано графічно, як на малюнку1.10.1.
Розподіл, показаний на малюнку,1.10.1 стосується лише моєї однієї сумки M&M. Можливо, вам буде цікаво розподіл кольорів для всіх M&M. Виробник M&M's надає деяку інформацію з цього приводу, але вони не говорять нам точно, скільки M&M кожного кольору вони коли-небудь виробляли. Натомість вони повідомляють про пропорції, а не частоти. На малюнку1.10.2 показані ці пропорції. Оскільки кожен M&M є одним із шести знайомих кольорів, шість пропорцій, показаних на малюнку, додають до одного. Ми називаємо Рисунок1.10.2 розподілом ймовірностей, тому що якщо ви вибираєте M&M випадковим чином, ймовірність отримання, скажімо, коричневого M&M дорівнює частці M & M, які є коричневими (0.30).

Зверніть увагу, що розподіли на малюнках1.10.1 і1.10.2 не ідентичні. Малюнок1.10.1 зображує розподіл у зразку55 M&M. 1.10.2На малюнку показані пропорції для всіх M&M. Шансові фактори, що стосуються машин, що використовуються виробником, вводять випадкові зміни в різні випускаються мішки. Деякі сумки матимуть розподіл кольорів, близький до малюнка1.10.2; інші будуть далі.
Безперервні змінні
Використовувана в даному прикладі змінна «color of M&M» є дискретною змінною, а її розподіл ще називають дискретним. Давайте тепер розширимо поняття розподілу на неперервні змінні. Дані, наведені в таблиці1.10.2, - це час, який знадобився одному з нас (DL), щоб навести курсор миші на невелику ціль у серії20 випробувань. Часи сортуються від найкоротшого до найдовшого. Змінна «час реагування» є безперервною змінною. З часом, виміряним точно (до багатьох знаків після коми), не очікується, що два рази відгуку будуть однаковими. Вимірювання часу в мілісекундах (тисячних частках секунди) часто досить точне, щоб наблизити безперервну змінну в психології. Як ви можете бачити в таблиці1.10.2, вимірювання відповідей DL таким чином не виробляло раз, два з яких були однаковими. В результаті розподіл частот був би неінформативним: він складатиметься з20 часів експерименту, кожен з частотою1.
568 | 720 |
577 | 728 |
581 | 729 |
640 | 777 |
641 | 808 |
645 | 824 |
657 | 825 |
673 | 865 |
696 | 875 |
703 | 1007 |
Рішенням цієї проблеми є створення згрупованого частотного розподілу. У згрупованому розподілі частот бали, що потрапляють у різні діапазони, зведені в таблицю. Таблиця1.10.3 показує згрупований розподіл частот за ці20 часи.
Діапазон | Частота |
---|---|
500-600 | 3 |
600-700 | 6 |
700-800 | 5 |
800-900 | 5 |
900-1000 | 0 |
1000-1100 | 1 |
Згруповані частотні розподіли можуть бути зображені графічно. 1.10.3На малюнку показано графічне зображення частотного розподілу в табл1.10.3. Такий вид графіка називається гістограмою. Пізніша глава містить цілий розділ, присвячений гістограмам.

Щільність ймовірності
Гістограма на малюнку1.10.3 зображує лише20 часи ДЛ в одному експерименті, який він виконав. Щоб уявити ймовірність, пов'язану з довільним рухом (яке може зайняти будь-яку позитивну кількість часу), ми повинні представляти всі ці потенційні часи відразу. Для цього будуємо розподіл для безперервної змінної часу. Розподіли для неперервних змінних називаються неперервними розподілами. Вони також несуть химерну назву щільності ймовірності. Деякі щільності ймовірності мають особливе значення в статистиці. Дуже важливий має форму дзвіночка, і називається нормальним розподілом. Багато природних явищ можна наблизити напрочуд добре цим розподілом. Він послужить для ілюстрації деяких особливостей всіх безперервних дистрибутивів.
Приклад нормального розподілу показаний на рис1.10.4. Ви бачите «дзвіночок»? Нормальний розподіл не є справжнім дзвіночком, однак, оскільки лівий і правий кінчики продовжуються на невизначений термін (ми не можемо намалювати їх далі, щоб вони виглядали так, ніби вони зупинилися на нашій діаграмі). Y-вісь у нормальному розподілі представляє «щільність ймовірності». Інтуїтивно він показує ймовірність отримання значень поблизу відповідних точок наX -осі. На малюнку1.10.4, наприклад, ймовірність спостереження зі значенням поруч40 становить приблизно половину ймовірності спостереження зі значенням поруч50. (Для отримання додаткової інформації, будь ласка, зверніться до розділу про звичайні дистрибутиви.)
Хоча цей текст не обговорює поняття щільності ймовірності детально, слід мати на увазі наступні ідеї щодо кривої, яка описує безперервний розподіл (наприклад, нормальний розподіл). По-перше, площа під кривою дорівнює1. По-друге, ймовірність будь-якого точного значенняX є0. Нарешті, площа під кривою і обмежена між двома заданими точками наX -осі - це ймовірність того, що число, вибране випадковим чином, потрапить між двома точками. Давайте проілюструємо рухами рук DL. По-перше, ймовірність того, що його рух займе якусь кількість часу, одна! (Ми виключаємо можливість того, що він ніколи не закінчує свій жест.) По-друге, ймовірність того, що його рух займає рівно598.956432342346576 мілісекунди, по суті дорівнює нулю. (Ми можемо зробити ймовірність якомога ближче до нуля, зробивши вимірювання часу все більш точним.) Нарешті, припустимо, що ймовірність руху DL займає між700 мілісекундами600 і становить одну десяту. Тоді безперервний розподіл для можливих часів ДЛ матиме форму, яка розміщує10% область нижче кривої в області, обмеженій600 осі та700 наX осі.

Форми розподілів
Розподіли мають різну форму; вони не всі виглядають як звичайний розподіл на малюнку1.10.4. Наприклад, нормальна щільність ймовірності вище посередині в порівнянні з двома її хвостами. Інші дистрибутиви не повинні мати цю функцію. Існує навіть варіація серед дистрибутивів, які ми називаємо «нормальними». Наприклад, деякі нормальні розподіли більш поширені, ніж показано на малюнку1.10.4 (їх хвости починають потрапляти поX осі далі від середини кривої - наприклад, при10 і90 якщо намальовано замість малюнка1.10.4). Інші менш розправлені (їх хвости можуть наближатися доX30 -осі в і70). Більш детальну інформацію про нормальному розподілі можна знайти в більш пізньому розділі, повністю присвяченому їм.
Розподіл, показаний на малюнку1.10.4, симетричний; якщо скласти його посередині, обидві сторони будуть ідеально збігатися. 1.10.5На малюнку показано дискретний розподіл балів на тесті з психології. Такий розподіл не симетричний: хвіст в позитивному напрямку простягається далі хвоста в негативну сторону. Кажуть, що розподіл з довшим хвостом, що поширюється в позитивному напрямку, має позитивний перекос. Він також описується як «перекіс вправо».

1.10.6На малюнку показані зарплати гравців вищої ліги бейсболу 1974 року (в тисячах доларів). Цей розподіл має крайній позитивний перекос.

Безперервний розподіл з позитивним перекосом показано на малюнку1.10.7.

Хоча і рідше, деякі дистрибутиви мають негативний перекіс. 1.10.8На малюнку показані бали за20 задачею -point на статистичному іспиті. Так як хвіст розподілу поширюється вліво, то цей розподіл перекошується вліво.

Гістограма на малюнку1.10.8 показує частоти різних балів на питання20 -point на статистичному тесті.

Безперервний розподіл з негативним перекосом показано на малюнку1.10.9. Показані досі розподіли мають одну окрему високу точку або пік. Розподіл на малюнку1.10.10 має дві чіткі піки. Розподіл з двома піками називається бімодальним розподілом.

Розподіли також відрізняються один від одного в плані того, наскільки великі або «жирні» їх хвости. 1.10.11На малюнку показані два розподіли, які відрізняються в цьому відношенні. Верхній розподіл має порівняно більше балів у хвостах; його форма називається лептокуртіческой. Нижній розподіл має відносно менше балів у хвостах; його форма називається платикуртіческой.

Автори та атрибуція
- Template:Lane
- David M. Lane and Heidi Ziemer