8.4: Частка населення
Протягом виборчого року ми бачимо статті в газеті, в яких зазначаються інтервали довіри з точки зору пропорцій або відсотків. Наприклад, опитування для конкретного кандидата, який балотується на пост президента, може показати, що кандидат має 40% голосів в межах трьох процентних пунктів (якщо вибірка досить велика). Часто виборчі опитування розраховуються з 95% впевненістю, тож опитувальники будуть на 95% впевнені, що справжня частка виборців, які віддали перевагу кандидату, становитиме від 0,37 до 0,43: (0,40 — 0,03,0,40 + 0,03).
Інвесторів на фондовому ринку цікавить справжня частка акцій, які щотижня йдуть вгору і вниз. Підприємства, які продають персональні комп'ютери, зацікавлені в частці домогосподарств у Сполучених Штатах, які володіють персональними комп'ютерами. Довірчі інтервали можуть бути розраховані для справжньої частки запасів, які щотижня зростають або зменшуються, а також для справжньої частки домогосподарств у Сполучених Штатах, які володіють персональними комп'ютерами.
Процедура пошуку довірчого інтервалу, розміру вибірки, прив'язки до помилки та рівня довіри для пропорції аналогічна процедурі для середньої чисельності населення, але формули різні. Звідки ви знаєте, що маєте справу з проблемою пропорції? По-перше, основний розподіл - це біноміальний розподіл. (Немає згадки про середнє або середнє значення.) ЯкщоX є біноміальною випадковою величиною, то
X∼B(n,p)
nде кількість випробувань іp ймовірність успіху.
Щоб сформувати пропорцію, візьмітьX, випадкову величину для числа успіхів і розділіть її наn, кількість випробувань (або розмір вибірки). Випадкова величинаP′ (читай «P prime») - це пропорція,
P′=Xn
(Іноді випадкову величину позначають якˆP, читаємо «P капелюх».)
Колиn великий іp не близький до нуля або одиниці, ми можемо використовувати нормальний розподіл для наближення біноміального.
X∼N(np,√npq)
Якщо розділити випадкову величину, середнє і стандартне відхилення наn, то отримаємо нормальний розподіл пропорцій зP′, званої розрахунковою часткою, як випадкової величини. (Нагадаємо, що пропорція як кількість успіхів ділиться наn.)
Xn=P′−N(npn,√npqn)
Використання алгебри для спрощення:
√npqn=√pqn
P′ слідує нормальному розподілу пропорцій:
Xn=P′−N(npn,√npqn)
Довірчий інтервал має вигляд
(p′–EBP,p′+EBP).
де
- EBPє похибкою, прив'язаною до пропорції.
- p′=xn
- p′=передбачувана частка успіхів (p′ - бальна оцінка для р, справжня пропорція.)
- x=кількість успіхів
- n=розмір зразка
Прив'язка до помилки (EBP) для пропорції дорівнює
EBP=(zα2)(√p′q′n)
деq =1−p′.
Ця формула аналогічна формулі, пов'язаної з похибкою для середнього, за винятком того, що «відповідне стандартне відхилення» відрізняється. Для середнього, коли відоме стандартне відхилення населення, відповідне стандартне відхилення, яке ми використовуємо, єσ√n. Для пропорції відповідним стандартним відхиленням є
√pqn.
Однак у формулі, пов'язаній з помилкою, ми використовуємо
√p′q′n
як стандартне відхилення, а не
√pqn.
У формулі, пов'язаній з помилкою, пропорції вибірки p′ і q′ є оцінками невідомих пропорцій населення p і q. q′Орієнтовні пропорціїp′p іq використовуються тому і не відомі. Пропорції вибіркиp′ іq′ розраховуються за даними:p′ є передбачуваною часткою успіхів, іq′ є передбачуваною часткою невдач.
Довірчий інтервал можна використовувати тільки в тому випадку, якщо кількість успіхівnp′ і кількість невдачnq′ обидва більше п'яти.
Нормальний розподіл пропорцій
Для нормального розподілу пропорцій формулаz -score виглядає наступним чином.
Якщо
P′−N(p,√pqn)
то формулаz -score
z=p′−p√pqn
Приклад8.4.1
Припустимо, що фірма з дослідження ринку найнята, щоб оцінити відсоток дорослих, які проживають у великому місті, які мають мобільні телефони. П'ятсот випадково відібраних дорослих жителів цього міста опитуються, щоб визначити, чи є у них стільникові телефони. З 500 опитаних людей 421 відповів «так» - вони володіють мобільними телефонами. Використовуючи рівень довіри 95%, обчислити оцінку довірчого інтервалу для справжньої частки дорослих жителів цього міста, які мають стільникові телефони.
Рішення А
- Перше рішення - крок за кроком (Solution A).
- У другому розв'язку використовується функція калькуляторів TI-83, 83+ або 84 (Рішення Б).
НехайX= кількість людей у вибірці, які мають стільникові телефони. Xє біноміальним.
X∼B(500,421500).
Щоб розрахувати довірчий інтервал, необхідно знайтиp′,q′, іEBP.
- n=500
- x=кількість успіхів=421
p′=xn=421500=0.842
- p′=0.842пропорція вибірки; це точкова оцінка частки населення.
q′=1–p′=1–0.842=0.158
З тих пірCL=0.95
α=1–CL=1–0.95=0.05(α2)=0.025.
Тоді
zα2=z0.025=1.96
Скористайтеся командою калькулятора TI-83, 83+ або 84+ invNorm (0.975,0,1), щоб знайтиz0.025. Пам'ятайте, що область праворуч відz0.025 є0.025 і область зліва відz0.025 є0.975. Це також можна знайти за допомогою відповідних команд на інших калькуляторах, за допомогою комп'ютера або за допомогою таблиці ймовірностей Standard Normal.
EBP=(zα2)√p′q′n=(1.96)√(0.842)(0.158)500=0.032
p′–EBP=0.842–0.032=0.81
p′+EBP=0.842+0.032=0.874
Довірчий інтервал для істинної біноміальної частки населення дорівнює(p′–EBP,p′+EBP)=(0.810,0.874).
Тлумачення
Ми оцінюємо з 95% впевненістю, що від 81% до 87,4% всіх дорослих жителів цього міста мають мобільні телефони.
Пояснення 95% рівня довіри
Дев'яносто п'ять відсотків довірчих інтервалів, побудованих таким чином, містили б справжнє значення для частки населення всіх дорослих жителів цього міста, які мають мобільні телефони.
Рішення B
Натисніть STAT
і стрілка до ТЕСТІВ
.
Стрілка вниз до A:1-PropZint
. Натисніть клавішу ENTER
.
Стрілка вниз до xx і введіть 421.
Стрілка вниз до nn і введіть 500.
Стрілка вниз до рівня C
і введіть .95.
Стрілка вниз для обчислення
і натисніть ENTER
.
Довірчий інтервал дорівнює (0,81003, 0,87397).
Вправа8.4.1
Припустимо, 250 випадково вибраних людей опитуються, щоб визначити, чи є вони власником планшета. З 250 опитаних 98 повідомили про володіння планшетом. Використовуючи рівень довіри 95%, обчислити оцінку довірчого інтервалу для справжньої частки людей, які володіють планшетами.
- Відповідь
-
(0.3315, 0.4525)
Приклад8.4.2
Для класного проекту студент політології у великому університеті хоче оцінити відсоток студентів, які є зареєстрованими виборцями. Він опитує 500 студентів і виявляє, що 300 є зареєстрованими виборцями. Обчислити 90% довіри інтервал для справжнього відсотка студентів, які зареєстровані виборців, і інтерпретувати довірчий інтервал.
Відповідь
- Перше рішення - крок за кроком (Solution A).
- У другому розв'язку використовується функція калькуляторів TI-83, 83+ або 84 (Рішення Б).
Рішення А
- x=300і
- n=500
p′=xn=300500=0.600
q′=1−p′=1−0.600=0.400
З тих пірCL=0.90
α=1–CL=1–0.90=0.10(α2)=0.05
zα2=z0.05=1.645
Скористайтеся командою калькулятора TI-83, 83+ або 84+ invNorm (0.95,0,1), щоб знайтиz0.05. Пам'ятайте, що область праворуч відz0.05 становить 0,05, а площа зліваz0.05 - 0,95. Це також можна знайти за допомогою відповідних команд на інших калькуляторах, за допомогою комп'ютера або за допомогою стандартної нормальної таблиці ймовірностей.
EBP=(zα2)√p′q′n=(1.645)√(0.60)(0.40)500=0.036
p′–EBP=0.60−0.036=0.564
p′+EBP=0.60+0.036=0.636
Довірчий інтервал для істинної біноміальної частки населення дорівнює(p′–EBP,p′+EBP)=(0.564,0.636).
Тлумачення
- Ми оцінюємо з 90% впевненістю, що справжній відсоток усіх учнів, які зареєстровані виборцями, становить від 56,4% до 63,6%.
- Альтернативне формулювання: Ми оцінюємо з 90% впевненістю, що від 56,4% до 63,6% ВСІХ студентів є зареєстрованими виборцями.
Пояснення 90% рівня довіри
Дев'яносто відсотків усіх довірчих інтервалів, побудованих таким чином, містять справжнє значення для населення відсотка студентів, які зареєстровані виборцями.
Рішення B
Натисніть STAT
і стрілка до ТЕСТІВ
.
Стрілка вниз до A:1-PropZint
. Натисніть клавішу ENTER
.
Стрілка вниз до xx і введіть 300.
Стрілка вниз до nn і введіть 500.
Стрілка вниз до рівня C
і введіть 0.90.
Стрілка вниз для обчислення
і натисніть ENTER
.
Довірчий інтервал дорівнює (0,564, 0,636).
Вправа8.4.2
Студент опитує свою школу, щоб побачити, чи є учні в шкільному окрузі за або проти нового законодавства щодо шкільної форми. Вона опитує 600 студентів і виявляє, що 480 проти нового законодавства.
- Обчислити 90% довіри інтервал для справжнього відсотка студентів, які проти нового законодавства, і інтерпретувати довірчий інтервал.
- У вибірці з 300 студентів 68% сказали, що вони володіють iPod і смартфон. Обчислити 97% довіри інтервал для справжнього відсотка студентів, які володіють iPod і смартфон.
- Відповідь на
-
(0.7731, 0.8269); Ми оцінюємо з 90% впевненістю, що справжній відсоток усіх студентів у окрузі, які виступають проти нового законодавства, становить від 77,31% до 82,69%.
- Відповідь б
-
Шістдесят вісім відсотків (68%) студентів володіють iPod і смартфон.
p′=0.68
q′=1–p′=1–0.68=0.32
З тих пірCL=0.97, як ми знаємо
α=1–0.97=0.03
і
α2=0.015.
Площа зліва відz0.05 дорівнює 0,015, а область праворуч від 1z0.05 — 0,015 = 0,985.
Використовуючи функцію калькулятора TI 83, 83+ або 84+ InvNorm (0.985,0,1),
z0.05=2.17
EPB=(zα2)√p′q′n=2.17√0.68(0.32)300≈0.0269
p′–EPB=0.68–0.0269=0.6531
p′+EPB=0.68+0.0269=0.7069
Ми 97% впевнені, що справжня частка всіх студентів, які володіють iPod та смартфоном, становить від 0.6531 до 0.7069.
Калькулятор
Натисніть STAT і стрілка до ТЕСТІВ.
Стрілка вниз до A:1-PropZint. Натисніть клавішу ENTER.
Стрілка вниз до x і введіть 300*0.68.
Стрілка вниз до п і введіть 300.
Стрілка вниз до рівня C і введіть 0.97.
Стрілка вниз для обчислення і натисніть ENTER.Довірчий інтервал дорівнює (0,6531, 0,7069).
«Плюс чотири» Довірчий інтервал дляp
Існує певна кількість похибки, введеної в процес обчислення довірчого інтервалу для пропорції. Оскільки ми не знаємо справжньої пропорції для населення, ми змушені використовувати точкові оцінки для обчислення відповідного стандартного відхилення розподілу вибірки. Дослідження показали, що отримана оцінка стандартного відхилення може бути помилковою.
На щастя, існує просте регулювання, яке дозволяє нам виробляти більш точні довірчі інтервали. Ми просто робимо вигляд, що маємо чотири додаткових спостереження. Два з цих спостережень - успіхи, а два - невдачі. Отже, новий розмір вибірки єn+4, і новий підрахунок успіхів єx+2. Комп'ютерні дослідження продемонстрували ефективність цього методу. Його слід використовувати, коли бажаний рівень довіри становить не менше 90%, а розмір вибірки - не менше десяти.
Приклад8.4.3
Випадкову вибірку з 25 студентів статистики запитали: «Ви курили сигарету за минулий тиждень?» Шість студентів повідомили про куріння протягом минулого тижня. Використовуйте метод «плюс-чотири», щоб знайти 95% довірчий інтервал для справжньої частки студентів статистики, які курять.
Рішення А
Шість студентів з 25 повідомили про куріння протягом останнього тижня, такx=6 іn=25. Оскільки ми використовуємо метод «плюс-чотири», ми будемо використовуватиx=6+2=8 іn=25+4=29.
p′=xn=829≈0.276
q′=1–p′=1–0.276=0.724
Так якCL=0.95, ми знаємоα=1–0.95=0.05 іα2=0.025.
z0.025=1.96
EPB=(zα2)√p′q′n=(1.96)√0.276(0.724)29≈0.163
p′–EPB=0.276–0.163=0.113
p′+EPB=0.276+0.163=0.439
Ми на 95% впевнені, що справжня частка всіх студентів статистики, які курять сигарети, становить від 0,113 до 0,439.
Рішення B
Натисніть STAT і стрілка до ТЕСТІВ.
Стрілка вниз до A:1-PropZint. Натисніть клавішу ENTER.
НАГАДУВАННЯ
Пам'ятайте, що метод плюс-чотири передбачає додаткові чотири випробування: два успіхи і дві невдачі. Вам не потрібно змінювати процес обчислення довірчого інтервалу; просто оновіть значення x і n, щоб відобразити ці додаткові випробування.
Стрілка внизx і введіть вісім.
Стрілка внизn і введіть 29.
Стрілка вниз до рівня C і введіть 0.95.
Стрілка вниз для обчислення і натисніть ENTER.
Довірчий інтервал дорівнює (0,113, 0,439).
Вправа8.4.3
З випадкової вибірки 65 першокурсників Державного університету 31 студент оголосив спеціальність. Використовуйте метод «плюс-чотири», щоб знайти 96% довірчий інтервал для справжньої частки першокурсників Державного університету, які оголосили про спеціальність.
Рішення А
Використовуючи «плюс чотири», ми маємоx=31+2=33 іn=65+4=69.
p′=3369≈0.478
q′=1–p′=1–0.478=0.522
Так якCL=0.96, ми знаємоα=1–0.96=0.04 іα2=0.02.
z0.02=2.054
EPB=(zα2)√p′q′n=(2.054)(√(0.478)(0.522)69)−0.124
p′–EPB=0.478–0.124=0.354
p′+EPB=0.478+0.124=0.602
Ми 96% впевнені, що від 35,4% до 60,2% всіх першокурсників штату U оголосили головним.
Рішення B
Натисніть STAT і стрілка на ТЕСТИ.
Стрілка вниз до A:1-PropZint. Натисніть клавішу ENTER.
Стрілка внизx і введіть 33.
Стрілка внизn і введіть 69.
Стрілка вниз до рівня C і введіть 0.96.
Стрілка вниз для обчислення і натисніть ENTER.
Довірчий інтервал дорівнює (0,355, 0,602).
Приклад8.4.4
Центр Беркмана для Інтернету та суспільства в Гарварді нещодавно провів дослідження, аналізуючи звички управління конфіденційністю підлітків користувачів Інтернету. У групі з 50 підлітків 13 повідомили, що мають більше 500 друзів у Facebook. Використовуйте метод «плюс чотири», щоб знайти 90% довіри інтервал для справжньої частки підлітків, які повідомляють про те, що мають більше 500 друзів Facebook.
Рішення А
Використовуючи «плюс-чотири», ми маємоx=13+2=15 іn=50+4=54.
p′=1554≈0.278
q′=1–p′=1−0.241=0.722
Так якCL=0.90, ми знаємоα=1–0.90=0.10 іα2=0.05.
z0.05=1.645
EPB=(zα2)(√p′q′n)=(1.645)(√(0.278)(0.722)54)≈0.100
p′–EPB=0.278–0.100=0.178
p′+EPB=0.278+0.100=0.378
Ми на 90% впевнені, що від 17,8% до 37,8% всіх підлітків повідомлять про те, що у Facebook є понад 500 друзів.
Рішення B
Натисніть STAT і стрілка на ТЕСТИ.
Стрілка вниз до A:1-PropZint. Натисніть клавішу ENTER.
Стрілка внизx і введіть 15.
Стрілка внизn і введіть 54.
Стрілка вниз до рівня C і введіть 0.90.
Стрілка вниз для обчислення і натисніть ENTER.
Довірчий інтервал дорівнює (0,178, 0,378).
Вправа8.4.4
Дослідження Центру Беркмана, про яке посилається в прикладі, розмовляли з підлітками в менших фокус-групах, але також опитували додаткових підлітків по телефону. Коли дослідження було завершено, 588 підлітків відповіли на запитання про своїх друзів у Facebook 159, сказавши, що у них більше 500 друзів. Використовуйте метод «плюс чотири», щоб знайти 90% довіри інтервал для справжньої частки підлітків, які повідомляють про те, що мають більше 500 друзів Facebook на основі цього більшого зразка. Порівняйте результати з результатами в Прикладі.
Відповідь
Рішення А
Використовуючи «плюс-чотири», ми маємоx=159+2=161 іn=588+4=592.
p′=161592≈0.272
q′=1–p′=1–0.272=0.728
Оскільки CL = 0,90, ми знаємоα=1–0.90=0.10 іα2=0.05
EPB=(zα2)(√p′q′n)=(1.645)(√(0.272)(0.728)592)≈0.030
p′–EPB=0.272–0.030=0.242
p′+EPB=0.272+0.030=0.302
Ми на 90% впевнені, що від 24,2% до 30,2% всіх підлітків повідомлять, що мають понад 500 друзів у Facebook.
Рішення B
- Натисніть STAT і стрілка на ТЕСТИ.
- Стрілка вниз до A:1-PropZint. Натисніть клавішу ENTER.
- Стрілка внизx і введіть 161.
- Стрілка внизn і введіть 592.
- Стрілка вниз до рівня C і введіть 0.90.
- Стрілка вниз для обчислення і натисніть ENTER.
- Довірчий інтервал дорівнює (0,242, 0,302).
Висновок: Довірчий інтервал для більшої вибірки вужчий, ніж інтервал з Прикладу. Більші зразки завжди дають більш точні довірчі інтервали, ніж менші зразки. Метод «плюс чотири» має більший вплив на меншу пробу. Вона зміщує оцінку точки з 0,26 (13/50) до 0,278 (15/54). Він надає менший вплив на ЕПБ, змінюючи його з 0,102 на 0,100. У більшій вибірці точкова оцінка зазнає меншого зрушення: від 0,270 (159/588) до 0,272 (161/592). Легко помітити, що метод plus-four має найбільший вплив на менші зразки.
Розрахунок розміру вибіркиn
Якщо дослідники бажають конкретної похибки, то вони можуть використовувати формулу, пов'язану з помилкою, для обчислення необхідного розміру вибірки. Формула, пов'язана з похибкою, для частки населення дорівнює
EBP=(zα2)(√p′q′n)
Рішення дляn дає рівняння для розміру вибірки.
n=(zα2)2(p′q′)EBP2
Приклад8.4.5
Припустимо, компанія мобільного телефону хоче визначити поточний відсоток клієнтів у віці 50+, які використовують текстові повідомлення на своїх мобільних телефонах. Скільки клієнтів у віці 50+ повинні провести опитування компанії, щоб бути 90% впевненим, що розрахункова (вибіркова) частка знаходиться в межах трьох процентних пунктів від справжньої частки населення клієнтів у віці 50+, які використовують текстові повідомлення на своїх мобільних телефонах.
Відповідь
З проблеми ми знаємо, щоEBP=0.03 (3% = 0,03) іzα2z0.05=1.645 тому, що рівень довіри становить 90%.
Однак для того, щоб знайтиn, нам потрібно знати розрахункову (вибіркову) пропорціюp′. Пам'ятайте про цеq′=1–p′. Але, миp′ поки не знаємо. Оскільки ми множимоp′ іq′ разом, ми робимо їх обидва рівними 0,5, тому щоp′q′=(0.5)(0.5)=0.25 призводить до найбільшого можливого продукту. (Спробуйте інші продукти:(0.6)(0.4)=0.24;(0.3)(0.7)=0.21;(0.2)(0.8)=0.16 і так далі). Максимально можливий продукт дає нам найбільшийn. Це дає нам достатньо велику вибірку, щоб ми могли бути впевнені на 90%, що ми знаходимося в межах трьох процентних пунктів від справжньої частки населення. Щоб розрахувати розмір вибіркиn, скористайтеся формулою і зробіть заміни.
n=z2p′q′EBP2
дає
n=1.6452(0.5)(0.5)0.032=751.7
Округляйте відповідь до наступного більшого значення. Розмір вибірки повинен становити 752 клієнти стільникових телефонів у віці 50+, щоб бути впевненими на 90%, що розрахункова (вибіркова) частка знаходиться в межах трьох процентних пунктів від справжньої частки населення всіх клієнтів у віці 50+, які використовують текстові повідомлення на своїх мобільних телефонах.
Вправа8.4.5
Припустимо, компанія з інтернет-маркетингу хоче визначити поточний відсоток клієнтів, які натискають на рекламу на своїх смартфоні. Скільки клієнтів слід провести опитування компанії, щоб бути впевненими на 90%, що передбачувана частка знаходиться в межах п'яти процентних пунктів від справжньої частки населення клієнтів, які натискають на рекламу на своїх смартфоні?
- Відповідь
-
Необхідно обстежитися 271 замовника. Перевірте розділ Нерухомість у вашому місцевому
Глосарій
- Біноміальний розподіл
- дискретна випадкова величина (RV), яка виникає з випробувань Бернуллі; існує фіксованеn число незалежних випробувань. «Незалежний» означає, що результат будь-якого судового розгляду (наприклад, судового розгляду 1) не впливає на результати наступних випробувань, і всі випробування проводяться в однакових умовах. За цих обставин біноміальний RVX визначається як кількість успіхів уn випробуваннях. Позначення це:X∼B(n,p). Середнє значення єμ=np і стандартне відхилення єσ=√npq. Імовірність точноx успіхів уn випробуваннях єP(X = x = \left(\binom{n}{x}\right))p^{x}q^{n-x}.
- Помилка прив'язана до пропорції населення (EBP)
- похибка; залежить від рівня довіри, розміру вибірки та оцінюваної (від вибірки) частки успіхів.