4.3: Геометричний розподіл
Геометрична функція щільності ймовірності будується на тому, що ми дізналися з біноміального розподілу. У цьому випадку експеримент триває до тих пір, поки не відбудеться успіх або невдача, а не для встановленої кількості випробувань. Існує три основні характеристики геометричного експерименту.
- Є одне або кілька випробувань Бернуллі з усіма невдачами, крім останнього, який є успішним. Іншими словами, ви продовжуєте повторювати те, що робите до першого успіху. Тоді ви зупиняєтеся. Наприклад, ви кидаєте дротик в яблучко, поки не потрапите в яблучко. Перший раз, коли ви потрапили в яблучко - це «успіх», тому ви перестанете кидати дротик. Це може зайняти шість спроб, поки ви не потрапите в яблучко. Ви можете думати про випробування як невдачу, невдачу, невдачу, невдачу, невдачу, успіх, СТОП.
- Теоретично кількість випробувань могло тривати вічно.
- Імовірність успіху та ймовірності невдачі однакова для кожного судового процесу.pq p+q=1іq=1−p. Наприклад, ймовірність прокатки трійки, коли ви кидаєте одну справедливу смерть, є16. Це правда незалежно від того, скільки разів ви котите плашку. Припустимо, ви хочете дізнатися ймовірність отримання перших трьох на п'ятому рулоні. На рулони один через чотири ви не отримаєте обличчя з трійкою. Імовірність для кожного з валків q =56, ймовірність виходу з ладу. Імовірність отримання трійки на п'ятому рулоні дорівнює(56)(56)(56)(56)(16)=0.0804
- X= кількість незалежних випробувань до першого успіху.
Приклад4.3.5
Ви граєте в азартну гру, яку ви можете або виграти, або програти (інших можливостей немає), поки не програєте. Ваша ймовірність програшу єp=0.57. Яка ймовірність того, що потрібно п'ять ігор, поки ви не програєте? НехайX = кількість ігор, в які ви граєте, поки не програєте (включає програшну гру). Тоді X приймає значення 1, 2, 3,... (Може тривати нескінченно). Ймовірність питання єP(x=5).
Вправа4.3.5
Ви кидаєте дартс на дошку, поки не потрапите в центральну область. Ваша ймовірність попадання в центральну область єp=0.17. Ви хочете знайти ймовірність того, що потрібно вісім кидків, поки ви не потрапите в центр. Які значенняX набуває?
Приклад4.3.6
Інженер з безпеки вважає, що 35% всіх промислових аварій на її заводі спричинені невиконанням працівниками інструкцій. Вона вирішує подивитися звіти про нещасні випадки (вибрані випадковим чином і замінені в купі після прочитання), поки не знайде той, який показує аварію, спричинену невиконанням працівників інструкцій. В середньому, скільки звітів очікує поглянути інженер з безпеки, поки вона не знайде звіт, що показує аварію, спричинену невиконанням працівником інструкцій? Яка ймовірність того, що інженер з безпеки повинен буде вивчити принаймні три звіти, поки вона не знайде звіт, що показує нещасний випадок, спричинений невиконанням працівником інструкцій?
НехайX = кількість аварій, які інженер з безпеки повинен вивчити, поки вона не знайде звіт, що показує нещасний випадок, спричинений невиконанням працівником інструкцій. X приймає значення 1, 2, 3,... Перше питання просить вас знайти очікуване значення або середнє значення. Друге питання просить вас знайтиP(x≥3). («Принаймні» перекладається на символ «більше або дорівнює»).
Вправа4.3.6
Інструктор відчуває, що 15% студентів отримують нижче C на підсумковому іспиті. Вона вирішує подивитися на випускні іспити (вибрані випадково і замінені в купі після прочитання), поки вона не знайде той, який показує оцінку нижче C. Ми хочемо знати ймовірність того, що інструктор повинен буде вивчити принаймні десять іспитів, поки вона не знайде один з оцінкою нижче C. викладено математично?
Приклад4.3.7
Припустимо, що ви шукаєте студента у вашому коледжі, який живе в межах п'яти миль від вас. Ви знаєте, що 55% з 25 000 студентів живуть в межах п'яти миль від вас. Ви випадково контактуєте зі студентами з коледжу, поки хтось не скаже, що він або вона живе в межах п'яти миль від вас. Яка ймовірність того, що потрібно зв'язатися з чотирма людьми?
Це геометрична проблема, тому що у вас може виникнути ряд невдач, перш ніж ви отримаєте той успіх, який ви хочете. Крім того, ймовірність успіху залишається приблизно однаковою кожен раз, коли ви запитуєте студента, чи живе він або вона в межах п'яти миль від вас. Немає певної кількості випробувань (кількість разів ви запитуєте студента).
а. нехайX = число ____________ ви повинні запитати ____________ один говорить так.
- Відповідь
-
a НехайX = кількість студентів, яких ви повинні запитати, поки хтось не скаже так.
б Які значенняX набуває?
- Відповідь
-
б. 1, 2, 3,..., (загальна кількість студентів)
c. що такеp іq?
- Відповідь
-
c.p=0.55;q=0.45
d Питання ймовірності єP (_______).
- Відповідь
-
д.P(x=4)
Позначення для геометричної: G = функція розподілу геометричних ймовірностей
X∼G(p)
Прочитайте це як "Xє випадковою величиною з геометричним розподілом.» Параметр єp;p = ймовірність успіху для кожного випробування.
Геометричний Pdf говорить нам про ймовірність того, що перше виникнення успіху вимагаєx кількості незалежних випробувань, кожен з ймовірністю успіху р Якщо ймовірність успіху на кожному випробуванні p, то ймовірність того, щоx й судовий процес (зx випробувань) є першим успіхом це:
P(X=x)=(1−p)x−1p
дляx=1,2,3,...
Очікувана величинаX, середнє значення цього розподілу, є1/p. Це говорить нам, скільки випробувань ми повинні очікувати, поки ми не отримаємо першого успіху, включаючи підрахунок випробування, яке призводить до успіху. Наведена вище форма геометричного розподілу використовується для моделювання кількості випробувань до першого успіху. Кількість випробувань включає той, який є успішним:x = всі випробування, включаючи той, який є успішним. Це можна побачити у вигляді формули. ЯкщоX = кількість випробувань, включаючи успіх, то треба помножити ймовірність невдачі(1−p), на кількість невдач, тобтоX−1.
На відміну від цього, для моделювання кількості невдач до першого успіху використовується наступна форма геометричного розподілу:
P(X=x)=(1−p)xp
дляx=0,1,2,3,...
У цьому випадку судовий процес, який є успішним, не зараховується як судовий розгляд у формулі:x = кількість невдач. Очікуване значення, середнє, цього розподілу єμ=(1−p)p. Це говорить нам, скільки невдач слід очікувати, перш ніж ми досягнемо успіху. У будь-якому випадку послідовність ймовірностей - це геометрична послідовність.
Приклад4.3.8
Припустимо, що ймовірність несправного компонента комп'ютера дорівнює 0,02. Компоненти вибираються випадковим чином. Знайдіть ймовірність того, що перший дефект викликаний сьомим випробуваним компонентом. Скільки компонентів ви очікуєте перевірити, поки один не виявиться несправним?
НехайX = кількість протестованих компонентів комп'ютера, поки не буде виявлено перший дефект.
X приймає значення1,2,3,... деp=0.02.X∼G(0.02)
ЗнайтиP(x=7). Відповідь:P(x=7)=(1−0.02)7−1×0.02=0.0177.
Імовірність того, що сьомий компонент є першим дефектом, дорівнює 0,0177.
ГрафікX∼G(0.02) - це:
yВісь -містить ймовірність тогоx, деX = кількість протестованих компонентів комп'ютера. Зверніть увагу, що ймовірності знижуються на загальний приріст. Цей приріст є однаковим співвідношенням між кожним числом і називається геометричною прогресією і, таким чином, назвою для цієї функції щільності ймовірності.
Кількість компонентів, які ви очікували б перевірити, поки не знайдете перший дефектний компонент, є середнім,μ=50.
Формула середнього для випадкової величини, визначеної як кількість невдач до першого успіху, дорівнюєμ=1p=10.02=50
Див. приклад4.3.9, де геометрична випадкова величина визначається як кількість випробувань до першого успіху. Очікуване значення цієї формули для геометричного буде відрізнятися від цього варіанту розподілу.
Формула для дисперсіїσ2=(1p)(1p−1)=(10.02)(10.02−1)=2,450
Стандартне відхиленняσ=√(1p)(1p−1)=√(10.02)(10.02−1)=49.5
Довічний ризик розвитку раку підшлункової залози становить приблизно один з 78 (1,28%). Нехай X = кількість людей, яких ви запитуєте, перш ніж хтось каже, що він або вона має рак підшлункової залози. Випадкова величина X в даному випадку включає в себе тільки кількість випробувань, які були невдачами і не враховує випробування, яке мало успіх у пошуку людини, у якого було захворювання. Відповідною формулою для цієї випадкової величини є друга представлена вище. Тоді X - дискретна випадкова величина з геометричним розподілом: X ~ G(178) або X ~ G (0,0128).
- Яка ймовірність того, що ви запитуєте 9 людей, перш ніж хтось скаже, що у нього рак підшлункової залози? Це питання, яка ймовірність того, що ви просите 9 людей безуспішно, а десята людина - успіх?
- Яка ймовірність того, що ви повинні запитати 20 осіб?
- Знайти (i) середнє і (ii) стандартне відхилення X.
- Відповідь
-
а.P(x=9)=(1−0.0128)9⋅0.0128=0.0114
б.P(x=20)=(1−0.0128)19⋅0.0128=0.01
- Середнє =μ=(1−p)p=(1−0.0128)0.0128=77.12
- Стандартне відхилення =σ=√1−pp2=√1−0.01280.01282≈77.62
Вправа4.3.9
Рівень грамотності для нації вимірює частку людей віком від 15 років, які вміють читати та писати. Рівень грамотності жінок в Об'єднаних колоніях незалежності становить 12%. НехайX = кількість жінок, яких ви запитаєте, поки одна не скаже, що вона грамотна.
- Що таке розподіл ймовірностейX?
- Яка ймовірність того, що ви запитаєте п'ять жінок, перш ніж одна скаже, що вона грамотна?
- Яка ймовірність того, що ви повинні запитати десять жінок?
Приклад4.3.10
Бейсболіст має ватин середній 0.320. Це загальна ймовірність того, що він отримує удар кожен раз, коли він знаходиться на кажані.
Яка ймовірність того, що він отримає свій перший удар в третій поїздці битою?
- Відповідь
-
P(x=3)=(1−0.32)3−1×.32=0.1480
У цьому випадку послідовність - невдача, невдача, успіх.
Скільки поїздок в биту ви очікуєте, що нападник потрібно, перш ніж отримати удар?
- Відповідь
-
μ=1p=10.320=3.125≈3
Це просто очікувана цінність успіхів і, отже, середнє значення розподілу.
Приклад4.3.11
Є 80% ймовірність того, що у собаки далматинців 13 чорних плям. Ви ходите на виставку собак і вважаєте місця на далматинців. Яка ймовірність того, що ви переглянете плями на 3 собаках, перш ніж виявите ту, яка має 13 чорних плям?
- Відповідь
-
P(x=3)=(1−0.80)3×0.80=0.0064
Виноски
1» Поширеність ВІЛ, загальна (% населення віком 15-49 років)», Світовий банк, 2013. Доступно в Інтернеті за адресою http://data.worldbank.org/indicator/...last&sort=desc (доступ до 15 травня 2013 р.).