5.6: Втручання, розподілені на групи
- Page ID
- 72288
Методи, описані в розділах 3 - 5, всі припускають, що окремі особи повинні бути одиницями розподілу. Іншими словами, пробні групи будуть ефективно побудовані шляхом складання повного списку осіб, доступних для судового розгляду та випадковим чином вибираючи, які особи повинні бути розподілені для кожної пробної групи. Однак, як пояснюється в розділі 4, розділ 4, багато польових випробувань не організовані таким чином. Замість цього групи осіб виділяються на досліджувані втручання. Ці групи часто називають кластерами і можуть відповідати громадам, наприклад, селам, хуторам або визначеним секторам міського району; установам, таким як школи або робочі місця; або пацієнтам, які відвідують певний медичний заклад.
Випробування, в яких спільноти або інші типи кластерів випадковим чином розподіляються до різних плечей випробування, відомі як кластерні рандомізовані випробування, а розрахунки розміру вибірки для таких випробувань представлені в розділі 6.1. Ступінчасті клинові випробування є модифікованою формою кластерного рандомізованого дослідження і обговорюються в розділі 6.2.
6.1 Кластерні рандомізовані випробування
Якщо кластери випадковим чином розподілені до різних випробувальних озброєнь, кластер також повинен використовуватися як одиниця аналізу, навіть якщо оцінки результатів робляться на індивідуальних кластерах (див. Розділ 8 глави 21). Наприклад, припустимо, що випробування москітної сітки має проводитися наступним чином. Ряд сіл (скажімо, 20) повинні бути випадковим чином розділені на дві групи рівного розміру. У десяти селах першої групи все населення кожного села отримають москітні сітки, тоді як друга група з десяти сіл буде служити контрольними. Аналіз впливу москітних сіток на наявність клінічної малярії буде проведений шляхом обчислення (з урахуванням віку) рівня захворюваності в кожному селі та порівняння десяти ставок для інтервенційних сіл з десятьма ставками для контрольних сіл. Це було б досягнуто шляхом розгляду (з урахуванням віку) швидкості як кількісного результату, виміряного для кожного села, та порівняння їх, використовуючи непарний t-тест або непараметричний тест на суму рангу (див. Розділ 8 глави 21). Якщо аналізувати пропорції, а не показники захворюваності, принцип однаковий - пропорція (з урахуванням віку) буде розглядатися як кількісний результат для кожного кластера.
Коли розподіл відбувається за кластером, формули пробного розміру повинні бути скориговані, щоб забезпечити внутрішню різницю між громадами. Припустимо, спочатку, що показники захворюваності в двох групах слід порівнювати. Необхідна кількість кластерів c задається:
\ [
c=1+\ ліворуч (z_ {1} +z_ {2}\ праворуч) ^ {2}\ ліворуч [\ ліворуч (r_ {1} +r_ {2}\ праворуч)/y+k^ {2}\ ліворуч (r_ {1} ^ {2} ^ {2}\ праворуч)\ праворуч]/\ ліворуч (r_ {1} ^ {2}\ праворуч)\ ліворуч (r_ {1} -r _ {2}\ праворуч) ^ {2}
\]
У цій формулі y - людина-роки спостереження в кожному кластері, тоді як r 1 і r 2- середні показники в кластерах втручання та контролю відповідно. Внутрішня варіація між кластерами вимірюється k, коефіцієнтом варіації (істинної) частоти падіння серед кластерів у кожній групі, і визначається як стандартна девіа- ція швидкостей, поділених на середню швидкість. Значення k приймається аналогічним в інтервенційній і контрольній групах, так що відносна мінливість залишається такою ж фоллуонирующей інтервенцією.
Якщо потрібно порівнювати пропорції, необхідну кількість кластерів задають:
\ [
c=1+\ ліворуч (z_ {1} +z_ {2}\ праворуч) ^ {2}\ ліворуч [2 р (1-р)/n+k^ {2}\ ліворуч (p_ {1} ^ {2}} ^ {2}\ праворуч)\ праворуч]/\ ліворуч (p_ {1} -p_ {2}\ праворуч) ^ {2}\ праворуч]/\ ліворуч (p_ {1} -p_ {2}\ праворуч) ^ {2}}
\]
У цій формулі n - пробний розмір в кожній спільноті; p 1 і p 2 - середні пропорції в інтервенційній і контрольній групах відповідно; p - середнє значення p 1і p 2, а k - коефіцієнт варіації (істинних) пропорцій між кластерами в кожній групі.
Оцінка k іноді буде доступна з попередніх даних про ті ж кластери або з пілотного дослідження. Якщо даних немає, можливо, доведеться зробити довільне, але правдоподібне припущення про значення k. Наприклад, k = 0,25 означає, що справжні показники в кожній групі коливаються приблизно між r i ± 2 kr i, тобто між 0,5 r і 1,5 r. В цілому k навряд чи перевищить 0,5.
Приклад: Припустимо, що випробування москітних сіток має проводитися шляхом виділення міжвенції на рівні села. Рівень захворюваності на клінічну малярію серед дітей до втручання становить 10 на 1000 дитячих тижнів спостереження, і дослідження має бути розроблено таким чином, щоб дати 90% потужності, якщо втручання зменшує рівень захворюваності на 50%. Є близько 50 дітей, які мають право на село, і він має намір продовжувати спостереження протягом 1 року, так що y становить приблизно 2500 дитячих тижнів. Немає інформації про зміну рівня захворюваності між селами. Беручи, кількість сіл, необхідних для групи, визначається наступним чином, так що приблизно сім сіл знадобиться в кожній групі:
\ [
c=1+ (1.96+1.28) ^ {2}\ ліворуч [(0.01+0.005)/2500+0,25^ {2}\ ліворуч (0.01^ {2} +0.005^ {2}\ праворуч)\ праворуч]/(0.01-0.005) ^ {2} =6.8
\]
Зауважте, що це дало б загалом 17 500 дитячих тижнів спостереження в кожній групі, порівняно з 6300 дитячими тижнями, якщо окремі діти були рандомізовані для отримання москітних сіток. На малюнку 5.2 показано кількість сіл, необхідних у кожній групі, де- очікують на дитячі тижні спостереження за селом та значення k.
Вплив розподілу груп на загальний необхідний розмір випробування залежатиме від ступеня, в якій особи в кластері, швидше за все, будуть схожі один на одного, ніж особи в іншому кластері для вимірювання результату в дослідженні. Якщо в результаті інтересу не існує гет-ерогенності між кластерами, в тому сенсі, що різниця між кластерними ставками або засобами не більше, ніж очікувалося б, відбудеться випадково, через варіації вибірки загальний розмір випробування буде приблизно таким же, як якби втручання були виділяється фізичним особам. Однак для більшості результатів існуватимуть реальні відмінності між кластерами, і за цих обставин необхідний розмір випробування буде більшим, ніж при індивідуальному розподілі. Співвідношення необхідних пробних розмірів з кластерним і індивідуальним виділенням іноді називають дизайнерським ефектом. На жаль, єдиного значення для ефекту проектування не можна припустити, оскільки його значення залежить від мінливості цікавить результату між кластерами і від розмірів кластерів, і тому рекомендується, щоб необхідний розмір вибірки оцінювався явно.

Малюнок 5.2 Кількість громад, необхідних у кожній групі в дослідженні впливу москітних сіток проти клінічної малярії.
Зверніть увагу, що навіть якщо розрахунки дозволяють припустити, що в кожній групі потрібно менше чотирьох кластерів, бажано мати принаймні чотири в кожній групі. Маючи так мало одиниць обсервації, використання непараметричних процедур, таких як тест на суму рангу, як правило, є кращим для аналізу, і розмір вибірки щонайменше чотири в кожній групі необхідний, щоб мати будь-які шанси на отримання значного результату при використанні цього тесту.
Можливо, можна зменшити необхідну кількість громад, прийнявши відповідний дизайн. Наприклад, це можна зробити, використовуючи базове дослідження, щоб організувати кластери на пари, в яких ставки цікавить результату схожі, і випадковим чином вибравши по одному члену кожної пари для отримання втручання. Однак важко кількісно оцінити вплив такого підходу на кількість необхідних кластерів. Для цього потрібна інформація про мінливість ефекту лікування між коммунітами та про те, наскільки базові дані прогнозують показники, які будуть спостерігатися протягом періоду спостереження за відсутності втручання, і ця інформація рідко доступна. При парній конструкції потрібно не менше шести кластерів в кожній групі, щоб мати можливість отримати істотну різницю за допомогою непараметричного статистичного тесту.
Додаткова інформація про розрахунки розміру вибірки для кластерних рандомізованих випробувань наведена в Hayes and Bennett (1999) та Hayes and Moulton (2009).
Відповідно до кількості дитячих тижнів спостереження в кожній громаді та ступеня варіації показників клінічної малярії між громадами (k - коефіцієнт варіації показників захворюваності; див. Текст). Середній рівень захворюваності на клінічну малярію за відсутності втручання приймається на рівні десяти на 10 000 тижнів спостереження, а дослідження потрібно мати 90% потужності для виявлення 50% зниження захворюваності на малярію при p < 0,05 рівні статистичної значущості.
6.2 Ступінчасті клинові випробування
Ступінчаста конструкція клина була представлена в розділі 4.3 глави 4 і є модифікацією кластерного рандомізованого випробування, в якому всі кластери починають випробування в контрольній групі. Потім втручання вводять поступово в кластери в довільному порядку, поки в кінці випробування всі кластери не перебувають у групі втручання.
Наслідком конструкції ступінчастого клина є те, що в більшості точок часу під час випробування буде нерівна кількість кластерів у групах втручання та контролю. Це означає, що, коли світські тенденції враховуються шляхом порівняння втручання з контрольними групами на кожному кроці, ступінчасте випробування клином може мати меншу потужність і точність, ніж стандартне кластерне рандомізоване випробування того ж розміру, в якому кількість в- і контрольних кластерів рівні по всьому. Коли існує нульова внутрішньокластерна кореляція, для випробування знадобиться до 50% більше кластерів. Щоб пристосуватися до цього, кількість кластерів потрібно помножити на поправочний коефіцієнт, який залежить від кількості «кроків» у конструкції ступінчастого клина. Якщо є п'ять кроків, поправочний коефіцієнт становить 1,3, підвищуючись приблизно до 1,4 для чисел кроків між 10 і 20. Коли внутрішньокластерна кореляція досить велика, приріст ефективності, який може бути досягнутий, скориставшись пре-пост інформації на кожному кластері може обігнати цей фактор, роблячи ступінчасте випробування клином більш ефективним, ніж паралельне випробування. Однак, щоб бути консервативним, можливо, найкраще роздути кількість скупчень.
Приклад: У розглянутому раніше випробуванні з москітною сіткою розрахунок розміру вибірки показав, що нам потрібно сім кластерів у кожній руці або загалом 14 кластерів. Якщо ми зараз запропонуємо провести цей розгляд за допомогою ступінчастого клинового випробування, консервативним виправленням було б помножити це число на 1,4, давши 20 кластерів. Наприклад, це може бути реалізовано з десятьма кроками протягом 5-річного періоду, забезпечуючи мережі для двох випадково обраних кластерів кожні півроку.