5.5: Більш складні конструкції
- Page ID
- 72246
5.1 Дві групи нерівного розміру
У розділах 3 і 4 розглядається найпростіша ситуація, коли дві групи, які підлягають com- pared, мають однаковий розмір. Іноді можуть бути підстави для бажаючих виділити більше особин в одну групу, ніж в іншу. Наприклад, якщо експериментальний препарат коштує дуже дорого, може знадобитися мінімізувати кількість пацієнтів, що виділяються на
наркотиків, і тому випробування може бути організовано так, що є два або три пацієнти, які дають старий препарат для кожного пацієнта, який дав новий препарат. Для того, щоб підтримувати таку ж потужність, як і в рівній схемі розподілу, знадобиться більший загальний пробний розмір, але кількість даних нового препарату буде меншою. І навпаки, під час випробування нової вакцини може бути вирішено виділити вдвічі більше учасників до вакцинованої групи, ніж включені до групи плацебо, щоб збільшити розмір бази даних безпеки для нового vac- cine, перш ніж вона перейде в програми охорони здоров'я.
Нехай розмір меншої з двох груп буде n 1, і припустимо, що співвідношення двох розмірів вибірки буде k, так що в іншій групі буде kn 1 особини (k >1) .Потім, щоб досягти приблизно такої ж потужності і точності, як у дослідженні з рівне число n у кожній групі, n 1 слід обрати як:
\ [
n_ {1} =n (к+1)/(2 к)
\]
Таблиця 5.5 Судовий розмір необхідний для досягнення приблизно однакової потужності в дослідженні з двома групами, одна з яких містить k разів більше осіб, ніж інша

Приклади наведені в таблиці 5.5 для різних значень k. Зверніть увагу, що число al-, розташоване в меншій групі, ніколи не може бути зменшено нижче половини числа, необхідного при рівних групах. Мало що отримують, збільшуючи k понад 3 або 4, оскільки, за цією точкою, навіть істотне збільшення n 2 досягає лише невеликого зменшення n 1.
5.2 Порівняння більш ніж двох груп
Польові випробування, що порівнюють дві групи (наприклад, втручання та контроль, або лікування А та лікування B), на сьогоднішній день є найпоширенішими. Однак в деяких випробуваннях можна порівняти три і більше груп. Наприклад, у випробуванні нової вакцини може бути чотири дослідні групи, які отримують різні дози вакцини. Для польових випробувань незвично мати більше чотирьох груп через логістичні обмеження або обмеження розміру випробувань.
Пропонується, що при проектуванні судового розгляду з трьома або більше групами слідчий повинен вирішити, які парні порівняння між групами представляють центральний інтерес. Методи розділів 3 та 4 можуть бути використані для визначення розміру пробного періоду, необхідного в кожній групі. Там, де існує одна контрольна група для порівняння з декількома групами втручання, цілком ймовірно, що основні парні порівняння будуть між кожною інтервенційною групою та контрольною групою. Однак зауважте, що прямі порівняння між групами втручання можуть бути неадекватними, оскільки, якщо кожне з інтервенцій має певний ефект, відмінності між групами втручання можуть бути меншими, ніж коли кожна порівнюється з контрольною групою.
5.3 Факторні конструкції
Як обговорювалося в розділі 3.2 глави 4, деякі випробування покликані одночасно розглядати наслідки двох втручань, використовуючи факторний дизайн. Наприклад, у\(2×2\) факторіальному дослідженні двох втручань A та B учасники випадковим чином розподіляються між чотирма пробними групами, які отримують лише A, лише B, як A, так і B, або контрольну групу, яка не отримує жодного втручання. Якщо ефекти А і В можна припустити незалежними, так що ефект А однаковий при наявності або відсутності В і навпаки, то ця пробна конструкція дозволяє виміряти ефекти двох втручань приблизно за ціною одного двогрупового випробування, що вимірює ефект одного втручання.
За цих умов незалежності основною зміною розрахунку розміру вибірки для\(2×2\) факторіального дослідження є те, що очікуваний результат у групах втручання та контролю для втручання А повинен бути скоригований на очікуваний ефект втручання Б. Це пояснюється прикладом.
Наприклад, припустимо, нас цікавить вплив добавок заліза (втручання А) та протималярійної профілактики (втручання В) на анемію під час вагітності. Припустимо, що поширеність анемії в контрольній групі, яка не отримує ні А, ні В, очікується 30%, що кожне втручання, як очікується, зменшить поширеність пропорційно на 20%, і що ці ефекти є незалежними. Тоді очікувані поширеності в чотирьох плечах судового процесу становитимуть: контроль— 30%; А лише— 24%; лише Б— 24%;\(A+B\) — 19,2%. У цьому факторіальному дослідженні ефект втручання А оцінюватиметься шляхом порівняння поширеності лише між групами\(A+B\) та B, а також лише між групою А та контрольною групою. Загальна поширеність у двох групах даного втручання А буде\(21.6%[=(24+19.2)/2]\) і в двох групах, не заданих A\(27%[=(30+24)/2]\) Оскільки різниця в поширеності трохи менша, ніж у простому двогруповому дослідженні, загальний розмір вибірки буде дещо більшим для факторного дизайну.
У деяких факторіальних випробуваннях ми можемо чітко поглянути на те, чи є наслідки двох втручань незалежними. Для цього потрібен тест на взаємодію або модифікацію ефекту, оскільки нас цікавить, чи відрізняється ефект А, наприклад, залежно від наявності або відсутності Б. тестування на взаємодію зазвичай вимагає набагато більшого розміру вибірки, ніж просте порівняння двох груп. Як приблизний орієнтир, загальний розмір вибірки для\(2×2\) факторіального випробування потрібно буде помножити принаймні на чотири, щоб виявити істотну взаємодію (подібного розміру до основних ефектів втручань) між ефектами двох втручань.
5.4 Випробування еквівалентності та неповноцінності
У більшості польових випробувань метою є визначення того, чи нове втручання перевершує контрольне втручання, наприклад, існуюче втручання. Однак у деяких випадках ми можемо продемонструвати, що нове втручання еквівалентно або, принаймні, не поступається існуючому втручанню. Наприклад, припустимо, що поточне лікування якогось стану, як відомо, є високоефективним, але воно також дорого і має деякі неприємні побічні ефекти. Тепер припустимо, що було розроблено нове лікування, яке є менш витратним і має менше побічних ефектів. Це, ймовірно, буде розглянуто для реалізації, якщо воно настільки ж ефективно, як і старе лікування. У цьому випадку ми можемо вирішити провести випробування еквівалентності, спрямоване на визначення того, чи мають ці два методи лікування подібну ефективність.
Для повноцінного обговорення подібних випробувань читач посилається на Blackwelder (1982) або Wang and Bakhai (2006). Однак для ілюстрації необхідних розрахунків розміру вибірки наведено простий приклад.
Приклад: Припустимо, що поточне лікування туберкульозу має рівень лікування близько 90%, але вимагає тривалого курсу лікування. Розроблено новий режим короткого курсу, який матиме переваги з точки зору вартості, зручності та дотримання. Ми хочемо провести випробування, щоб визначити, чи є швидкість лікування для режиму короткого курсу еквівалентна показнику поточного режиму. Зазвичай ми робимо це, визначивши нижню межу швидкості лікування, нижче якої ми більше не вважаємо лікування «еквівалентними». Якщо ми встановимо це на рівні 85%, судовий процес повинен бути включений, щоб продемонструвати, що різниця в швидкості лікування становить не більше 5%. Нульова гіпотеза тепер полягає в тому, що нове лікування поступається старому лікуванню, і ми змушуємо випробування відхилити цю нульову гіпотезу і оголосити еквівалентність двох методів лікування, якщо нове лікування має швидкість лікування, яка не поступається стандартному лікуванню більш ніж вказані 5%.
Змінюючи перше рівняння в розділі 4.1 відповідним чином, нам потрібні n пацієнтів у кожній групі, де:
\[\boldsymbol { n } = \left[ \left( z _ { 1 } + z _ { 2 } \right) ^ { 2 } 2 p ( 1 - p ) \right] / D ^ { 2 }\]
У цьому рівнянні p - очікувана швидкість затвердіння 90% в обох групах, припускаючи еквівалентність, а D - прийнятний запас неповноцінності, який у цьому прикладі становить 5%. Таким чином, для 90% потужності і двостороннього тесту значущості з p=0,05, p=0,05 ми маємо:
\[n = \left[ ( 1.96 + 1.28 ) ^ { 2 } \times 2 \times 0.90 \times 0.10 \right] / 0.05 ^ { 2 } = 756\]
Загалом, для перевірки еквівалентності потрібні великі розміри вибірки.