Skip to main content
LibreTexts - Ukrayinska

5.4: Розмір, щоб дати адекватну потужність

  • Page ID
    72265
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Альтернативний підхід до встановлення пробного розміру заснований на виборі пробного розміру для досягнення заданої потужності. Для того щоб це зробити, необхідно вказати наступне:

    1. Який розмір різниці, D, між двома групами мав би значення для клінічного чи громадського здоров'я? Судовий розмір буде обраний таким чином, щоб він мав хороші шанси виявити цей розмір справжньої різниці, тобто був би хороший шанс отримати статистично значущий результат, таким чином зробивши висновок, що існує реальна різниця між двома пробними руками. D - справжня різниця між двома групами, а не розрахункова різниця, виміряна в дослідженні. Дуже невеликі відмінності, як правило, не мають значення для громадського здоров'я, і це не викликало б занепокоєння, якби вони не були виявлені в дослідженні. Загальний принцип, у більшості випадків, полягає в тому, щоб вибрати D як мінімальну різницю, яка мала б значення для охорони здоров'я і тому має важливе значення для виявлення в дослідженні. Зауважте, що «виявлення» D означає, що отримана значна різниця, що вказує на наявність певної різниці між двома групами. Це не означає, що різниця оцінена точно. Щоб забезпечити отримання точної оцінки, слід використовувати підхід Розділу 3.
    2. Вказавши D, слідчі повинні вирішити, наскільки впевнені вони хочуть бути в отриманні значного результату, якщо це була справжня різниця між групами. Іншими словами, для цього значення D встановлюється потужність. Зауважте, що якщо справжня різниця між групами насправді більше D, потужність випробування буде більшою за встановлене значення. Необхідна потужність вказується в розрахунках шляхом вибору відповідного значення z2, z2, як показано в таблиці 5.1. Зазвичай вибрані значення потужності становлять 80%, 90% та 95%, відповідні значення z2z2 становлять 0,84, 1,28 та 1,64. Як правило, вважається незадовільним продовжувати судовий розгляд із силою менше 70% для первинного результату, оскільки це означає, що шанс «пропустити» справжню різницю D буде більше 30%.
    3. Рівень значущості також повинен бути вказаний для порівняння двох досліджуваних груп. Це вноситься в розрахунки в плані параметраZ1Z1найбільш поширеним вибором для необхідного p-значення є 0,05, що відповідає az1z1з 1,96. Альтернативними значеннями можуть бути 0,01 або 0,001, що відповідає значенням z1z1 2,58 або 3,29 відповідно. У цій главі передбачається використання двосторонніх тестів на значущість (див. Розділ 2.3 глави 21). Рівень значущості 0,05 приймається в числових прикладах, якщо не вказано інше.
    4. Крім того, повинна бути вказана певна додаткова інформація, яка змінюється залежно від типу досліджуваного заходу. Це може бути приблизна оцінка очікуваних ставок або пропорцій, або оцінка стандартного відхилення для кількісної змінної. Зверніть увагу, що, якби ці величини були точно відомі, ніяких випробувань не було б потрібно! Потрібні лише приблизні оцінки.

    Зазначивши ці значення, формули або таблиці, наведені в розділах 4.1 - 4.3, можуть бути використані для обчислення необхідного розміру пробного періоду.

    Однак часто корисно діяти у зворотному напрямку, тобто досліджувати потужність, яка була б досягнута для діапазону можливих пробних розмірів та для діапазону можливих значень істинної різниці D. Це дозволяє побудувати криві потужності, як показано на малюнку 5.1. Формули для цього підходу також наведені в розділах 4.1 - 4.3.

    Таблиця 5.1 Співвідношення між\(z_2\) і% потужності (числа в тілі таблиці показують потужність, відповідну кожному значенню\(z_2\)

    Перший десятковий знак\(z_2\)
    \(z_2\) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
    −3.0 0.1 0.1 0.1 0.0 0.0 0.0 0.0 0.0 0.0 0.0
    −2.0 2.3 1.8 1.4 1.1 0.8 0.6 0.5 0.3 0.3 0.2
    −1.0 15,9 13,6 11.5 9.7 8.1 6.7 5.5 4.5 3.6 2.9
    −0,0 50.0 46.0 42.1 38.2 34.5 30.9 27.4 24.2 21.2 18.4
    +0.0 50.0 54.0 57.9 61.8 65.5 69.1 72.6 75.8 78.8 81.6
    +1.0 84.1 86.4 88.5 90.3 91.9 93.3 94.5 95.5 96.4 97.1
    +2.0 97.7 98.2 98.6 98.9 99.2 99.4 99.5 99.7 99.7 99.8
    +3.0 99.9 99.9 99.9 100.0 100.0 100.0 100.0 100.0 100.0 100.0

    Примітка: наприклад,\(z_2=−0.7\) відповідає потужності 24,2%.

    4.1 Порівняння пропорцій

    Пробний розмір, необхідний у кожній групі для виявлення зазначеної різниці\(D=p_1−p_2\), з потужністю, заданою z2z2і рівнем значущості\(z_1\), заданої, задається:

    \[n=[(z_1+z_2)^22p(1−p)]/(p_1−p_2)^2\]

    де p - середнє значення\(p_1\)\(p_2\) і.Для 90% потужності і значущості при\(p<0.05,\) цьому спрощує:

    \[n=[21p(1−p)]/(p_1−p_2)^2.\]

    У таблиці 5.2 показаний необхідний пробний розмір для діапазону значень p1p1і p2p2 для 80%, 90% або 95% потужності.

    Щоб розрахувати потужність випробування заданого розміру, розрахуйте наступним чином, і відносіть значення\(z_2\) до таблиці 5.1.

    \[z2=(√ \{n/[2p(1−p)]\})(|p_1−p_2|)−z1.\]

    Приклад: припустимо, що частота селезінки в контрольній групі дослідження москітної сітки становить близько 40%. Мати дуже високу потужність (скажімо, 95%) виявлення значного ефекту, якщо втручання зменшує частоту селезінки до 30% (так що\(p=0.35\) кількість дітей, необхідних у кожній групі, дається:

    \[n=[(1.96+1.64)^2(2×0.35×0.65)]/(0.3−0.4)^2=590.\]

    Якщо справжнє співвідношення ризику R, і ми хочемо провести випробування, таким чином, що нижня межа довіри щодо коефіцієнта ризику буде більше або дорівнює RLRL, Де RLrLє найнижчою прийнятною ефективністю (скажімо, для того, чи слід впроваджувати втручання в систему охорони здоров'я, тобто ми повинні бути впевнений, що ефективність принаймні\(R_L\)), необхідний розмір вибірки:

    \[n=(z_1+z_2)^2[(1−p_1)/(p_1)+(1−p_2)/(p_1)]/[\log_e(R/R_L)]^2.\]

    Таблиця 5.2 Вимоги до розміру вибірки для порівняння пропорцій

    Менший підпірку. \(p_1\) Різниця\(D=p_2−p_1\)
    0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60
    0,05 435 141 76 50 36 28 22 18 15 13 11 10
    583 189 102 67 48 37 30 25 21 18 15 13
    719 233 126 83 60 46 37 30 26 22 19 16
    0,10 686 200 101 63 44 33 26 21 17 14 12 10
    919 268 135 84 59 44 34 28 23 19 16 14
    1134 330 166 104 72 54 42 34 28 24 20 17
    0,15 906 251 122 74 50 37 28 22 18 15 13 10
    1212 336 163 98 67 49 38 30 24 20 17 14
    1497 415 201 122 83 60 46 37 30 25 21 18
    0,20 1094 294 139 82 55 40 30 24 19 16 13 11
    1464 394 186 110 74 53 40 31 25 21 17 15
    1808 486 230 136 91 66 50 39 31 26 21 18
    0,25 1250 329 153 89 59 42 31 24 19 16 13 11
    1674 441 205 119 79 56 42 32 26 21 17 14
    2067 544 253 147 97 69 52 40 32 26 21 18
    0,30 1376 357 163 94 61 43 32 24 19 16 13 10
    1842 478 219 126 82 58 43 33 26 21 17 14
    2274 590 270 156 101 71 53 40 32 26 21 17
    0,35 1470 376 170 97 63 44 32 24 19 15 12 10
    1968 504 228 130 84 58 43 32 25 20 16 13
    2430 622 282 160 103 72 53 40 31 25 20 16
    0,40 1533 388 174 98 63 43 31 24 18 14 11
    2052 520 233 131 84 58 42 31 24 19 15
    2534 642 287 162 103 71 52 39 30 24 19
    0,45 1564 392 174 97 61 42 30 22 17 13
    2094 525 233 130 82 56 40 30 23 18
    2586 648 287 160 101 69 50 37 28 22
    0,50 1564 388 170 94 59 40 28 21 15
    2094 520 228 126 79 53 38 28 21
    2586 642 282 156 97 66 46 34 26
    0,55 1533 376 163 89 55 37 26 18
    2052 504 219 119 74 49 34 25
    2534 622 270 147 91 60 42 30
    0,60 1470 357 153 82 50 33 22
    1968 478 205 110 67 44 30
    2430 590 253 136 83 54 37
    0,65 1376 329 139 73 44 28
    1842 441 186 98 59 37
    2274 544 230 121 72 46
    0,70 1250 294 122 63 36
    1674 394 163 84 48
    2067 486 201 104 60
    0,75 1094 251 101 50
    1464 336 135 67
    1808 415 166 83
    0,80 906 200 76
    1212 268 102
    1497 330 126
    0,85 686 141
    919 189
    1134 233
    0,90 435
    583
    719

    Наведені в тілі таблиці розміри вибірки, необхідні в кожній групі для надання заданої потужності. * Верхня цифра: потужність, 80%; середня цифра: потужність, 90%; нижня цифра: потужність, 95%. Використовуючи двосторонній тест на значущість зP<0.05.p<0.05, дві групи приймаються рівним розміром.

    4.2 Порівняння показників захворюваності

    Для заданої різниці\(D=r_1−r_2\) і значень\(z_1\) і\(z_2\) представляють необхідний рівень значущості і потужності, необхідну кількість людино-років в кожній групі задають:

    \[y=[(z_1+z_2)^2(r_1+r_2)]/(r_1−r_2)^2\]

    де\(r_1\) і\(r_2\) є очікувані ставки на людину-рік у двох групах.Тому потрібна приблизна оцінка середнього показника двох ставок, тобто\([(r_1+r_2)/2]\) для 90% потужності та значущості при p <0,05p<0,05 ця формула спрощує:

    \[y=[10.5(r_1+r_2)]/(r_1−r_2)^2.\]

    Альтернативна, але еквівалентна формула дає кількість подій, необхідних в групі 2, контрольній групі, в перерахунку на коефіцієнт швидкості R, для якого потрібна задана потужність:

    \[e_2=[(z_1+z_2)^2(1+R)]/(1−R)^2.\]

    Ця формула була використана для побудови таблиці 5.3, яка показує кількість подій, необхідних у групі 2 для виявлення коефіцієнта швидкості R з 80%, 90% або 95% потужності. Загальна кількість подій, необхідних в обох групах, може бути розрахована як\(e_2(1+R)\).

    Оскільки це можна обчислити без вказівки передбачуваних ставок у двох пробних групах, це забезпечує особливо корисний підхід, коли ставки невизначені. Таким чином, у випробуванні, керованому кінцевою точкою, ми можемо вказати кількість подій, які потрібно спостерігати, щоб досягти необхідної потужності, після чого набір або подальше спостереження може бути припинено.

    Щоб розрахувати потужність для заданого пробного розміру, обчислити:

    \[z_2=\{√[n/(r_1+r_2)]\}(|r_1−r_2|)−z_1\]

    де |r1−r2||r1−r2|— абсолютне значення різниці між двома швидкостями.

    Зверніться\(z_2\) до отриманого значення таблиці 5.1, щоб визначити потужність судового розгляду.

    Приклад: Припустимо, в дослідженні москітних сіток, що рівень смертності від малярії в контрольній групі становить 10/1000 дитячих років, так що\(r_2=0.010.\) вісімдесят відсотків потужності хочуть виявити значний ефект, якщо справжній рівень у дітей з ліжковими сітками зменшується на 70% до\(r_1=0.003.\) кількості дитячих років спостереження, необхідне в кожній групі, дається:

    \[y=[(1.96+0.84)^2(0.003+0.010)]/(−0.007)^2=2080.\]

    Криві потужності, показані на малюнку 5.1, були побудовані з використанням того ж припущення щодо рівня смертності в елементах управління. Наприклад, при\(y=2000\) і коефіцієнт співвідношення\(R=0.7\) (що відповідає показнику смертності 7 на 1000 дитини-років в групі втручання), що дає владу 18% (табл. 5.1):

    \[z_2=\{√[2000/(0.007+0.010)]\}(|0.007−0.010|)−1.96=−0.93.\]

    Ці формули використовуються для забезпечення високої ймовірності відхилення нульової гіпотези, якщо істинний ефект має передбачуваний розмір. Однак це все ще може означати, що нижня межа довіри для розміру ефекту близька до нульового, і це може надати недостатньо доказів, щоб рекомендувати широке прийняття втручання. Більший розмір вибірки буде необхідний для того, щоб нижня межа довіри перевищувала задане значення.Припустимо, передбачуване значення коефіцієнта швидкості є R, і що ми хочемо провести випробування, так що існує висока ймовірність того, що CI виключає значення RLRL, що відповідає нижній межі ефективності. бажаний. Потім необхідний розмір вибірки задається за формулою:

    \[y=(z_1+z_2)^2(1/r_1+1/r_2)/[\log_e(R/R_L)]^2.\]

    Приклад: У дослідженні москітної сітки ми виявили, що 2080 дитячих років потрібно було в кожній дослідній групі відхилити нульову гіпотезу з 80% потужності, якщо істинне співвідношення швидкості R становило 0,3, що відповідає ефективності 70%. Тепер припустимо, ми хочемо переконатися, що існує 80% ймовірність того, що нижчий 95% CI для ефективності перевищує 30%, що відповідає\(R_L=0.7.\) Застосовуючи формулу, ми отримуємо наступне, демонструючи значне збільшення розміру вибірки, що це вимагатиме:

    \[y=(1.96+0.84)^2(1/0.010+1/0.003)/[\log_e(0.3/0.7)]^2=4732.\]

    Таблиця 5.3 Вимоги до розміру вибірки для порівняння ставок

    Відносна швидкість R * Очікувані події в групі 2 дати +
    80% потужність 90% потужність 95% потужність
    0.1 10.6 14.3 17.6
    0.2 14.7 19.7 24.3
    0.3 20.8 27.9 34.4
    0.4 30.5 40.8 50.4
    0,5 47.0 63.0 77.8
    0.6 78.4 105.0 129.6
    0.7 148.1 198.3 244,8
    0.8 352.8 472.4 583.2
    0.9 1489.6 1994.5 2462.4
    1.1 1646.4 2204.5 2721.6
    1.2 431.2 577.4 712.8
    1.4 117,6 157.5 194.4
    1.6 56.6 75.8 93.6
    1.8 34.3 45.9 56.7
    2.0 23.5 31.5 38.9
    2.5 12.2 16.3 20.2
    3.0 7.8 10.5 13,0
    5.0 2.9 3.9 4.9
    10.0 1.1 1.4 1.8

    Числа в тілі таблиці - це очікувана кількість подій, необхідних у групі 2, щоб дати задану потужність, якщо відносна швидкість в групі 1 дорівнює R.

    * R, відношення захворюваності в групі 1 до рівня захворюваності в групі 2.

    + Використання двостороннього тесту значущості з\(p<0.05\) .Дві групи приймаються рівним розміром.

    4.3 Порівняння засобів

    Пробний розмір, необхідний у кожній групі для виявлення зазначеної різниці\(D=μ_1−μ_2,\) з визначеною потужністю\(z_2\) та рівнем значущості,\(z_1,\) визначеною, задається:

    \[n=[(z_1+z_2)^2(σ_1^2+σ_2^2)]/(μ_1−μ_2)^2\]

    де\(σ_1\) і\(σ_2\) є стандартними відхиленнями змінної результату в групах 1 і 2 відповідно.Для 90% потужності і значущості при\(p<0.05\), це спрощує:

    \[n=10.5(σ_1^2+σ_2^2)/(μ_1−μ_2)^2.\]

    Щоб розрахувати потужність проби заданого розміру, розрахуйте наступне, і зверніться\(z_2\) до значення таблиці 5.1:

    \[z_2=\{√[n/(σ^2_1+σ_2^2)]\}(|μ_1−μ_2|)−z_1.\]

    Оцінки σ 1σ 1 і σ 2σ 2можуть бути отримані з попередніх досліджень або з пілотного дослідження. Якщо відповідні значення неможливо визначити, альтернативою є дихотомізація неперервної змінної результату та використання формул розміру вибірки для порівняння пропорцій, наведених у розділі 4.1. Це дасть консервативну оцінку розміру вибірки, оскільки вона ігнорує частину інформації, але забезпечить адекватний розмір вибірки в умовах невизначеності щодо стандартних відхилень.

    Приклад: У дослідженні москітної сітки середній показник PCV в контрольній групі в кінці випробування, як очікується, складе 33,0, зі стандартним відхиленням 5,0. Щоб мати 90% потужності виявлення значного ефекту, якщо втручання збільшує середній показник ПХВ на 1,5, кількість дітей, необхідних в кожній групі, дають:

    \[n = \left[ ( 1.96 + 1.28 ) ^ { 2 } \left( 5.0 ^ { 2 } + 5.0 ^ { 2 } \right) \right] / ( 1.5 ) ^ { 2 } = 233\]

    Припустимо, виходить, що для навчання в кожній групі доступно всього 150 дітей. Владу в цих обставин дають наступні, відповідні владі близько 74%:

    \[z_2=\{√[150/(5.02+5.02)]\}(|1.5|)−1.96=0.64.\]

    Короткий зміст різних формул, які були наведені для розрахунку вимог до розміру пробного зразка для порівняння двох груп однакового розміру, наведено в таблиці 5.4.

    Таблиця 5.4 Зведення формул розрахунку вимог до розміру пробного зразка для порівняння двох груп однакового розміру

    Тип результату Формула Позначення Розділ в тексті
    В: Вибір пробного розміру для досягнення належної точності
    Пропорції: \(n = \left( 1.96 / \log _ { e } f \right) ^ { 2 } \left\{ \left[ ( R + 1 ) / \left( R p _ { 2 } \right) \right] - 2 \right\}\)

    n = число в кожній групі

    R = проп. в групі 1/опор.

    в групі 2Дає 95% CI від R/f до Rf

    3.1
    Тарифи: \(e _ { 2 } = \left( 1.96 / \log _ { \mathrm { e } } f \right) ^ { 2 } [ ( R + 1 ) / R ]\)

    \(e^2\)= очікувані події в групі 2

    R = ставка в групі 1/ставка в групі 2

    Дає 95% CI від R/f до Rf

    3.2
    Засоби: \(n = ( 1.96 / f ) ^ { 2 } \left( \sigma _ { 1 } ^ { 2 } + \sigma _ { 2 } ^ { 2 } \right)\)

    n = число в кожній групі

    \(σ_i=SD\)в групі i

    D = середнє значення в групі 1 − середнє значення у групі 2

    Дає 95% КІ\(D±f\)

    3.3
    B: Вибір пробного розміру для досягнення адекватної потужності
    Пропорції: \(n = \left[ \left( z _ { 1 } + z _ { 2 } \right) ^ { 2 } 2 p ( 1 - p ) \right] / \left( p _ { 1 } - p _ { 2 } \right) ^ { 2 }\)

    n = число в кожній групі

    \(p^i\)= пропорцій. в групі i

    р = середнє значення p1p1 і p2p2

    4.1
    Тарифи: \(y = \left[ \left( z _ { 1 } + z _ { 2 } \right) ^ { 2 } \left( r _ { 1 } + r _ { 2 } \right) \right] / \left( r _ { 1 } - r _ { 2 } \right) ^ { 2 }\)

    y = людино-роки в кожній групі

    \(r^i\)= ставка в групі i

    4.2
    Засоби: \(n = \left[ \left( z _ { 1 } + z _ { 2 } \right) ^ { 2 } \left( \sigma _ { 1 } ^ { 2 } + \sigma _ { 2 } ^ { 2 } \right) \right] / \left( \mu _ { 1 } - \mu _ { 2 } \right) ^ { 2 }\)

    n = число в кожній групі

    \(σ_i=SD\)в групі i

    \(μ_i\)= середнє в групі i

    4.3

    \(z_1=1.96\)для значущості при\(p<0.05\)

    Потужність 80%, 90%, 95%

    \(z_2=0.84, 1.28, 1.64\)