4.4: Розподіл Пуассона
Іншим корисним розподілом ймовірностей є розподіл Пуассона, або розподіл часу очікування. Цей розподіл використовується для визначення кількості касових клерків, необхідних для підтримки часу очікування в рядку до заданих рівнів, як можуть знадобитися телефонні лінії, щоб утримати систему від перевантаження, і багато інших практичних застосувань. Модифікація Пуассона, Паскаль, винайдений майже чотири століття тому, сьогодні використовується телекомунікаційними компаніями по всьому світу для факторів навантаження, рівня підключення супутників та проблем з пропускною здатністю Інтернету. Розподіл отримує свою назву від Симеона Пуассона, який представив його в 1837 році як розширення біноміального розподілу, яке ми побачимо, можна оцінити за допомогою Пуассона.
Є дві основні характеристики експерименту Пуассона.
- Розподіл ймовірності Пуассона дає ймовірність ряду подій, що відбуваються за фіксований проміжок часу або простору, якщо ці події відбуваються з відомою середньою швидкістю.
- Події відбуваються незалежно від часу з моменту останньої події. Наприклад, редактор книг може зацікавити кількість слів, написаних неправильно в певній книзі. Можливо, в середньому є п'ять слів, написаних неправильно на 100 сторінках. Інтервал становить 100 сторінок, і передбачається, що немає ніякого зв'язку між тим, коли виникають орфографічні помилки.
- Випадкова величинаX = кількість входжень у цікавому інтервалі.
Приклад4.4.12
Банк розраховує отримувати в середньому шість поганих чеків на день. Яка ймовірність того, що банк отримає менше п'яти поганих чеків в будь-який день? Відсоток становить кількість чеків, які банк отримує за один день, тому часовий проміжок відсотків становить один день. НехайX = кількість поганих чеків, які банк отримує за один день. Якщо банк розраховує отримувати шість поганих чеків в день, то в середньому шість чеків на день. Напишіть математичне твердження для питання ймовірності.
- Відповідь
-
P(x<5)
Приклад4.4.13
Ви помічаєте, що репортер новин каже «uh», в середньому, два рази за трансляцію. Яка ймовірність того, що репортер новин каже «ух» більше двох разів за трансляцію.
Це проблема Пуассона, тому що ви зацікавлені в тому, щоб знати, скільки разів репортер новин говорить «uh» під час трансляції.
а. який інтервал цікавить?
- Відповідь
-
a. одна трансляція вимірюється в хвилинах
б Яка середня кількість разів, коли репортер новин говорить «uh» під час однієї трансляції?
- Відповідь
-
б. 2
с. нехайX = ____________. Які значенняX набуває?
- Відповідь
-
c НехайX = кількість разів, коли репортер новин говорить «ух» під час однієї трансляції.
x=0,1,2,3,...
d Питання ймовірності єP (______).
- Відповідь
-
д.P(x>2)
Позначення для Пуассона: P = функція розподілу ймовірностей Пуассона
X∼P(μ)
Прочитайте це як "Xє випадковою величиною з розподілом Пуассона.» Параметр -\ (\ mu (або λ);\ mu (або λ) = середнє значення для цікавить інтервалу. Середнє - це кількість явищ, які відбуваються в середньому протягом інтервального періоду.
Формула обчислення ймовірностей, які є з процесу Пуассона, така:
P(x)=μxe−μx!
де ймовірністьX успіхів,μ -P(X) очікувана кількість успіхів на основі історичних даних, е - натуральний логарифм, приблизно рівний 2,718, іX це кількість успіхів на одиницю, як правило, за одиницю часу.
Для того щоб використовувати розподіл Пуассона, повинні дотримуватися певних припущень. Це: ймовірність успіху, незмінна в межах інтервалуμ, не може бути одночасних успіхів у інтервалі, і, нарешті, що ймовірність успіху між інтервалами є незалежною, те саме припущення про біноміальний розподіл.
У певному сенсі розподіл Пуассона можна розглядати як розумний спосіб перетворення безперервної випадкової величини, як правило, часу, в дискретну випадкову величину, розбиваючи час на дискретні незалежні інтервали. Такий спосіб мислення про Пуассона допомагає нам зрозуміти, чому його можна використовувати для оцінки ймовірності дискретної випадкової величини з біноміального розподілу. Пуассон просить про ймовірність ряду успіхів протягом певного періоду часу, тоді як біноміал просить про ймовірність певної кількості успіхів для певної кількості випробувань.
Приклад4.4.14
Автовідповідач Лії отримує близько шести телефонних дзвінків між 8 ранку та 10 ранку Яка ймовірність того, що Лія отримає більше одного дзвінка протягом наступних 15 хвилин?
Нехай X = кількість дзвінків, які Лія отримує за 15 хвилин. (Інтервал інтересу становить 15 хвилин або14 годину.)
x=0,1,2,3,...
Якщо Лія отримує, в середньому, шість телефонних дзвінків за дві години, а є вісім 15-хвилинних інтервалів в дві години, то Лія отримує
(18)(6) = 0,75 дзвінків за 15 хвилин, в середньому. Отже,\ mu = 0.75 для цієї проблеми.
X∼P(0.75)
ЗнайтиP(x>1).P(x>1)=0.1734
Імовірність того, що Лія отримує більше одного телефонного дзвінка протягом наступних 15 хвилин, становить близько 0,1734.
ГрафікX∼P(0.75) - це:
yВісь -містить ймовірністьx whereX = кількість викликів за 15 хвилин.
Приклад4.4.15
Згідно з опитуванням професор університету отримує в середньому 7 листів на день. Нехай X = кількість електронних листів, які професор отримує в день. Дискретна випадкова величина X приймає значення x = 0, 1, 2... Випадкова величина X має розподіл Пуассона: X ~ P (7). Середнє значення - 7 листів.
- Яка ймовірність того, що користувач електронної пошти отримує рівно 2 листи в день?
- Яка ймовірність того, що користувач електронної пошти отримує не більше 2 електронних листів на день?
- Що таке стандартне відхилення?
- Відповідь
-
а.P(x=2)=μxe−μx!=72e−72!=0.022
б.P(x≤2)=70e−70!+71e−71!+72e−72!=0.029
c Стандартне відхилення =σ=√μ=√7≈2.65
Приклад4.4.16
Користувачі текстових повідомлень отримують або надсилають в середньому 41,5 текстових повідомлень на день.
- Скільки текстових повідомлень користувач отримує або надсилає текстові повідомлення на годину?
- Яка ймовірність того, що користувач текстового повідомлення отримує або надсилає два повідомлення на годину?
- Яка ймовірність того, що користувач текстового повідомлення отримує або надсилає більше двох повідомлень на годину?
- Відповідь
-
a.let X = кількість текстів, які користувач надсилає або отримує за одну годину. Середня кількість отриманих текстів на годину становить41.524 ≈ 1.7292.
б.P(x=2)=μxe−μx!=1.7292e−1.7292!=0.265
c.P(x>2)=1−P(x≤2)=1−[70e−70!+71e71!+72e−72!]=0.250
Приклад4.4.17
13 травня 2013 року, починаючи з 16:30, ймовірність низької сейсмічної активності протягом наступних 48 годин на Алясці повідомлялося приблизно 1,02%. Використовуйте цю інформацію протягом наступних 200 днів, щоб знайти ймовірність того, що через десять з наступних 200 днів буде низька сейсмічна активність. Використовуйте як біноміальні, так і Пуассонові розподіли для обчислення ймовірностей. Вони близькі?
- Відповідь
-
Нехай Х = кількість днів з низькою сейсмічною активністю.
Використання біноміального розподілу:
P(x=10)=200!10!(200−10)!×.010210×.9898190=0.000039Використання розподілу Пуассона:
Розрахуватиμ=np=200(0.0102)≈2.04P(x=10)=μxe−μx!=2.0410e−2.0410!=0.000045
Ми очікуємо, що наближення буде хорошим, оскількиn є великим (більше 20) іp малим (менше 0,05). Результати близькі - обидві ймовірності, про які повідомляється, майже 0.
Оцінка біноміального розподілу з розподілом Пуассона
Раніше ми виявили, що біноміальний розподіл надавав наближення для гіпергеометричного розподілу. Тепер ми знаходимо, що розподіл Пуассона може забезпечити наближення для бінома. Ми говоримо, що біноміальний розподіл наближається до Пуассона. Біноміальний розподіл наближається до розподілу Пуассона, оскільки n стає більшим, а p малим таким чином, що np стає постійним значенням. Є кілька емпіричних правил, коли можна сказати, що вони будуть використовувати Пуассона для оцінки біноміального. Один припускає, що np, середнє значення біноміалу, має бути менше 25. Інший автор припускає, що воно повинно бути менше 7. А інший, зазначивши, що середнє значення і дисперсія Пуассона однакові, припускає, що np і npq, середнє і дисперсія біноміала, повинні бути більше 5. Немає жодного широко прийнятого правила для того, коли можна використовувати Пуассона для оцінки біноміального.
Коли ми рухаємось через ці розподіли ймовірностей, ми переходимо до більш складних розподілів, які в певному сенсі містять менш складні розподіли всередині них. Це твердження було доведено математиками. Це доводить нас до найвищого рівня складності в наступному розподілі ймовірностей, який може бути використаний як наближення до всіх тих, про які ми обговорювали досі. Це нормальний розподіл.
Приклад4.4.18
Опитування 500 людей похилого віку в Price Business School дає наступну інформацію. 75% йдуть прямо на роботу після закінчення школи. 15% продовжують працювати на їх MBA. 9% залишаються, щоб отримати неповнолітнього в іншій програмі. 1% продовжують отримувати магістра в галузі фінансів.
Яка ймовірність того, що більше 2 людей похилого віку підуть до аспірантури для свого магістра в галузі фінансів?
- Відповідь
-
Це явно біноміальна проблема розподілу ймовірностей. Вибір є двійковим, коли ми визначаємо результати як «Вища школа фінансів» проти «всіх інших варіантів». Випадкова величина дискретна, а події, можна припустити, незалежні. Вирішуючи як біноміальну задачу, ми маємо:
Біноміальне рішення
n⋅p=500⋅0.01=5=μ
P(0)=500!0!(500−0)!0.010(1−0.01)500−0=0.00657
P(1)=500!1!(500−1)!0.011(1−0.01)500=0.03318
P(2)=500!2!(500−2)!0.012(1−0.01)5002=0.08363
Складання всіх 3 разом = 0,1339
1−0.12339=0.87661
наближення Пуассона
n⋅p=500⋅0.01=5=μ
n⋅p⋅(1−p)=500⋅0.01⋅(0.99)≈5=σ2=μ
P(X)=e−np(np)xx!={P(0)=e−5⋅500!}+{P(1)=e−5⋅511!}+{P(2)=e−5⋅522!}
0.0067+0.0337+0.0842=0.1247
1−0.1247=0.8753
Наближення, яке вимкнено на 1 тисячну, безумовно, є прийнятним наближенням.