3.2: Систематичні огляди
- Page ID
- 72157
Перегляд літератури може бути складним завданням. Обсяг інформації, доступної через опубліковані статті, або Інтернет, величезний і постійно розширюється. Враховуючи обсяг доступної літератури, «рекламний» огляд літератури підлягає суттєвим упередженням, якщо включені лише деякі дослідження, оскільки дослідження, які виявляються таким чином, цілком можуть бути репрезентативними для всіх відповідних досліджень. Найкращий спосіб забезпечити об'єктивний та неупереджений огляд літератури - це провести огляд, який дотримується суворих вказівок, щоб мінімізувати упередженість у виборі та інтерпретації повідомлених досліджень.
Основні етапи систематичного огляду наведені у Вставці 3.1.
У цьому розділі ми надаємо короткий огляд кожного з цих кроків. Додаткові відомості наведені в опублікованих керівних принципах, таких як посібник Кокрана для систематичних оглядів втручань (Higgins and Green, 2008) та настанови PRISMA (Бажані елементи звітності для систематичних оглядів та мета-аналізу) (< http://www.prisma-statement.org >) ( Liberati et al., 2009), і книги про систематичні огляди в дослідженнях охорони здоров'я (Egger et al., 2001, Glasziou, 2001, Khan, 2003).
Вставка 3.1 П'ять основних кроків систематичного огляду
- Визначення питання.
- Визначення відповідних досліджень зумовленим, систематичним способом.
- Оцінка якості кожного відповідного дослідження.
- Підсумовуючи докази.
- Інтерпретація висновків.
2.1 Визначення питання
Першим кроком у систематичному огляді є визначення дослідницького питання. Структурований підхід для формування питання корисний - підхід PICOS (популяція; втручання (або експозиція); порівняння; результати; дизайн дослідження) (Хіггінс і Грін, 2008) використовується як Cochrane, так і PRISMA.
Наприклад, систематичний огляд узагальнив докази ефективності поведінкових втручань для запобігання ВІЛ-інфекції серед молоді в країнах Африки на південь від Сахари (Napierala Mavedzenge et al., 2011). Питання огляду було структуровано, використовуючи підхід PICOS, наступним чином:
- Населення: серед молоді віком 10—24 років в Африці на південь від Сахари.
- Втрудження/впливо/порівняння:. робить вплив втручання, зосереджене на зниженні поведінки ризику ВІЛ, відносно відсутності або мінімального втручання,.
- Результати:. зменшити ризик ВІЛ, ІПСШ або вагітності.
- Дизайн дослідження:. при оцінці за допомогою експериментальних або квазіекспериментальних конструкцій дослідження?
Другий приклад, використаний в цьому розділі, - систематичний огляд доказів того, що вживання жувальних речовин (таких як бездимний тютюн або горіхи бетеля) пов'язане з серцево-судинними захворюваннями (ССЗ) в Азії (Zhang et al., 2010). В даному випадку питання було структуровано наступним чином:
- Населення: Серед людей в азіатських країнах.
- Втручання/експозиція/порівняння:. робить вплив жувальних речовин, щодо не жування їх,.
- Результати:. підвищення ризику ССЗ.
- Дизайн дослідження:. коли оцінюється за допомогою спостережно-епідеміологічних досліджень?
Попередні систематичні огляди розглядали це питання в Сполучених Штатах Америки (США) та Швеції, але синтезу доказів з Азії не було. Якщо були знайдені вагомі докази асоціації, це може призвести до розробки та оцінки втручання, спрямованого на зменшення жування бетеля у цих популяціях.
Після того, як питання дослідження буде виявлено, для огляду слід підготувати детальний протокол. Це включатиме визначення стратегії пошуку та заплановані аналізи. Планується розробити міжнародний реєстр систематичних оглядів на чолі з Центром оглядів та розповсюдження (< http://www.york.ac.uk/inst/crd/index.htm >), який дозволить дослідникам зареєструвати свій протокол рецензування. Це розширить реєстр, розроблений Кокранівським співробітництвом (< http://www.cochrane.org >), який був створений у 1993 році для сприяння систематичним оглядам медичних втручань. Дослідники, які проводять огляди в рамках Кокранівського співробітництва, зобов'язані заздалегідь зареєструвати протокол для їх розгляду, а огляд перед публікацією рецензується. Однак багато систематичних оглядів проводяться поза межами співпраці і наразі не можуть бути зареєстровані.
2.2 Визначення відповідної літератури
Три широко використовуваних електронних медичних баз даних - MEDLINE (доступний вільно через PubMed за адресою < http://www.ncbi.nlm.nih.gov/PubMed >), Embase (<www.embase.com>) та CENTRAL (Кокранівський центральний реєстр контрольованих випробувань<www.cochrane-handbook.org>). Комплексна стратегія пошуку вимагає пошуку кожної з цих баз даних (Higgins and Green, 2008). Однак ці бази даних мають північноамериканський/європейський упередження, і для досліджень в LMICs варто також шукати інші відповідні бази даних, такі як LILACS (література з наук про здоров'я Латинської Америки), Африканська лінія здоров'я, GlobalHealth та Popline. Крім того, існує безліч суб'єктно-специфічних баз даних, таких як PsychInfo (для психології та пов'язаних з ними поведінкових та соціальних наук), а також пошукових систем в Інтернеті, таких як Google Scholar. Також може бути корисним пошук баз даних конференцій та реєстрів випробувань для виявлення додаткових документів.
Стратегії можуть бути використані для ідентифікації як слів вільного тексту в базі даних, так і контрольованих термінів (званих MESH в MESH, тобто заголовки медичних предметів), які використовуються як ключові слова. Стратегії пошуку повинні включати ключові терміни в оглядовому питанні та використовувати логічні оператори (такі як «І», «АБО», «НЕ») для отримання пошуку, який є чутливим і специфічним для дослідницького питання. Стратегія пошуку, що використовується на прикладі жувальних речовин і ССЗ в Азії, наведена у Вставці 3.2.
Часто рецензенти вже знають про деякі ключові опубліковані дослідження. Корисно перевірити, чи всі вони були ідентифіковані за допомогою пошуку в електронній базі даних. Якщо ні, то ретельний перегляд стратегії пошуку може встановити причину цього, і пошук може бути змінений відповідно.
Таблиця 3.1 Критерії включення: приклад систематичного огляду поведінкових втручань для запобігання ВІЛ-інфекції серед молоді в Африці на південь від Сахари
| Компонент PICOS (див. текст) | Критерії включення | Критерії виключення |
|---|---|---|
| Чисельність населення | Молоді люди у віці 10—24 років. У дослідженнях з більш широким віковим діапазоном повинен бути аналіз впливу втручання на молодих людей (10—24 роки) або, принаймні, в частині цього вікового діапазону. У Африці на південь від Сахари. Базується в школі та/або медичному закладі та/або територіально визначеній громаді. | Вивчення населення не представника загальної популяції молодих людей (наприклад, молодих секс-працівників) .Менше 100 осіб в дослідженні. |
| Втручання/експозиція | Поведінкове втручання зосереджено на одному або декількох з наступних питань:
|
|
| Порівняння ПК | Відсутність або мінімальне поведінкове втручання. | Немає відповідної групи порівняння (наприклад, ненордомізоване дослідження лише з даними після втручання). Немає коригування відмінностей між групами, які можуть змістити результати. |
| O результат | Принаймні один з наступних виміряних:
|
Вимірюється менш ніж через 3 місяці після початку втручання. |
| S дизайн дослідження | Опубліковано в 2005—2008 роках (оскільки попередній систематичний огляд охоплював період до кінця 2004 року) .Рандомізовані та нерандомізовані епідеміологічні дослідження, які включали сучасну групу порівняння або аналіз серій до - після/час лише в групі втручання. |
Вставка 3.2 Приклад стратегії пошуку доказів зв'язку між жувальними речовинами та ССЗ, ішемічною хворобою серця або цереброваскулярними захворюваннями в Азії
Ми шукали PubMed (до липня 2010 р.), використовуючи терміни: («серцево-судинні захворювання» [MESH] АБО («серцево-судинні» [Усі поля] І «хвороби» [Усі поля]) АБО «серцево-судинні захворювання» [Усі поля] АБО «цереброваскулярні розлади» АБО («цереброваскулярні» [Усі поля]) АБО ' цереброваскулярні розлади' [Усі поля] АБО «інсульт» [MESH] АБО «інсульт» [Усі поля] АБО «смертність» АБО смертність*) І («бетель квід» АБО «бетель-горіх» АБО «горіхи бетеля» АБО «орека горіхи» АБО «паан» АБО «пан» АБО «нюх» АБО «нюх» АБО «снус» АБО «гуль» АБО «гутка» АБО «хайні» АБО «пухкий лист» АБО «марас» АБО «мава» АБО «mishri» АБО «naswar» АБО «Areca catechu» АБО «зубний порошок» АБО «шамма» АБО «тютюнова жувальна гумка» АБО «zarda» АБО «тютюн, бездимний» [MESH] АБО «жувальний тютюн» АБО «тютюн для некурящих») І («когортні дослідження» [MESH] АБО «крос-секційні дослідження» [MESH]] АБО «кейс-контрольні дослідження '[MESH] АБО («когорта» [TI] І шпилька* [TI]) АБО (випадк* [TI] І контроль* [TI]) АБО «перспективний» АБО «ретроспективний» АБО «поперечний переріз» АБО «поперечний переріз»), що дало 1006 потенційно релевантних посилань. Ми адаптували стратегію пошуку для другого пошуку в ISI Web of Science (оновлено 19 липня 2010 р.) і знайшли ще 739 посилань. Ми визначили всі спостережні дослідження, включаючи когорти, дослідження кейс-контролю та дослідження поперечного перерізу, за умови, що вони досліджували зв'язок між коли-небудь вживанням жувальних речовин та виникненням (захворюваністю або смертністю) ССЗ та повідомили про силу асоціацій з кількісним ризиком кошторис. Не було обмежень щодо мови, року навчання чи статусу публікації.
Текстовий екстракт, відтворений з Чжан, Л.Н. та ін., Жувальні речовини з тютюном або без нього та ризик серцево-судинних захворювань в Азії: мета-аналіз, Журнал університету Чжецзян Наука B, Том 11, випуск 9, с.681—9, Авторське право © Чжецзянський університет та Springer-Verlag Berlin Heidelberg 2010 . На це поле не поширюються умови ліцензії Creative Commons цієї публікації. Для отримання дозволу на повторне використання, будь ласка, зв'яжіться з правовласником.
2.2.2 Рецензування тез
Стратегія пошуку зазвичай визначає кілька тисяч потенційно релевантних паперів. Наступним кроком є те, щоб два рецензента самостійно прочитали анотацію кожної статті та визначали її як потенційно релевантну чи ні. На цьому етапі рекомендується помилитися на стороні обережності, тобто включати як «потенційно релевантний», якщо релевантність незрозуміла з анотації. Потім два рецензенти повинні порівняти свої результати та узгодити будь-які відмінності шляхом обговорення, подальшого посилання на тези або третього рецензента, який самостійно читає анотацію.
2.2.3 Рецензування повних статей
Повні копії всіх робіт, тези доповідей яких вважалися потенційно актуальними, повинні бути отримані (в електронному вигляді, з бібліотек або по електронній пошті автору). Вони повинні бути розглянуті двома рецензентами, які самостійно оцінюють, чи відповідає кожна стаття кожному з критеріїв включення/виключення. Розбіжності повинні бути вирішені, що стосується тез.
2.2.4 Ручний пошук
Наступним кроком стратегії пошуку, як правило, є перегляд довідкових списків усіх відповідних досліджень, виявлених з пошуку в електронній базі даних, для виявлення будь-яких досліджень, які були пропущені цим пошуком, але на які посилаються у відповідних роботах.
Попередні оглядові статті також слід прочитати, щоб перевірити, чи не було пропущено жодних відомих паперів. Нарешті, законно, хоча іноді вимагає багато часу, включати неопубліковані дослідження, які можна ідентифікувати через колег або контактувати з слідчими неопублікованих досліджень, наприклад, виявлених за допомогою пошукових запитів в Інтернеті або судових реєстрів. Важливо також визначити поточні дослідження, де це можливо, оскільки вони можуть бути включені в оновлення огляду.
2.2.5 Блок-схема пошукової стратегії
Шаблон для блок-схеми, що підсумовує результати пошуку, наведено на малюнку 3.1. На прикладі поведінкових втручань серед молоді в країнах Африки на південь від Сахари з електронних баз даних було визначено 1173 статті, з яких 137 були визнані потенційно актуальними після перегляду їх назв та тез, а також отримано повнотекстові статті. Після виключення тих, хто не відповідає критеріям включення, остаточний огляд включав 40 робіт, що представляли 23 дослідження (як іноді результати одного дослідження повідомлялися в більш ніж одній роботі) (Napierala Mavedzenge et al., 2011). На прикладі жувальних речовин і ССЗ в Азії було виявлено 1756 публікацій з електронних баз даних, з яких тільки шість мали право на включення в аналіз ССЗ (Zhang et al., 2010).
2.3 Описовий синтез досліджень
Коли відповідні документи були визначені, форма вилучення даних повинна бути заповнена для кожного дослідження, яка містить поля, що дозволяють детальний опис дизайну дослідження та результатів. Наприклад, описові елементи включали б компоненти PICOS, як це обговорюється в розділі 2.1. Результати повинні зосереджуватися на заздалегідь визначених результатах у протоколі огляду та включатимуть результати, визначення експозиції/втручань, заходи ефекту та 95% довірчих інтервалів (CI). Форма повинна бути перевірена пілотом на декількох зразках паперів і переглянута, у міру необхідності. Потім два рецензента детально читають кожну статтю незалежно, підсумовують статтю до форми вилучення даних та оцінюють ризик упереджень. Загальний ярлик, який є допустимим, полягає в тому, що один рецензент завершує форму вилучення даних, а інший потім перевіряє та редагує її, остаточну версію на основі обговорення будь-яких розбіжностей.
Наступним кроком є початок узагальнення доказів прийнятних досліджень в цілому. Усі огляди повинні включати описову таблицю включених досліджень, які узагальнюють досліджувану популяцію, втручання, порівняння, результат та дизайн дослідження. Одне з 23 досліджень, які були виявлені в огляді поведінкових втручань серед молоді, узагальнено в таблиці 3.2.
У таблицю, яка підсумовує результати кожного дослідження, повинні бути включені всі заходи первинного і вторинного результату. Для бінарного результату це включало б пропорцію з результатом серед відкритих та неекспонованих груп, відповідний показник ефекту (наприклад, коефіцієнт ризику (RR), коефіцієнт ставки (RR) або коефіцієнт шансів (OR)) та 95% CI. Для безперервних результатів слід вказати середнє, стандартне відхилення у виставленому та неекспонованому, а також міру ефекту (наприклад, стандартизована середня різниця).

Від Moher et al., Бажані елементи звітності для систематичних оглядів та мета-аналізів: заява ПРИЗМА, Медицина PLoS, Том 6, випуск 7, e1000097, Авторське право © Moher et al. 2009. Ця цифра відтворюється зі статті з відкритим доступом, розповсюдженої на умовах Ліцензії Creative Commons Attribution License, яка дозволяє необмежене використання, розповсюдження та відтворення на будь-якому носії, за умови зараховування оригінального автора та джерела.
Таблиця 3.2 Опис одного з досліджень, включених до систематичного огляду молодіжних втручань проти ВІЛ-інфекції в країнах Африки на південь від Сахари
| Навчання, місце розташування та програма | Тип втручання і настройка | Цільова популяція, основні цілі, порівняння та результати дослідження | Опис втручання | Дизайн дослідження |
|---|---|---|---|---|
| Об'єднана Республіка Танзанія, MEMA для Vijana | Школи: освіта з питань сексуального та репродуктивного здоров'я на основі вчителя. Медичний заклад: заходи для сприяння дружності до молоді постачальників послуг, пов'язані з втручаннями в громаді та в інших секторах (школах), для сприяння прийняттю та використанню | Цільове населення: особи віком 12—19 років у сільській місцевості. Основні цілі: Затримка сексуальної ініціації, збільшення використання презервативів, зменшення кількості сексуальних партнерів та збільшення використання медичних послуг, особливо для послуг сексуального та репродуктивного здоров'я. Порівняльна рука: поточна (дуже обмежена) освіта про сексуальне та репродуктивне здоров'я в школах та відсутність додаткових втручань у медичних закладах або в широкій громаді. Результати дослідження: Первинний: захворюваність на ВІЛ; поширеність HSV2. Вторинні: вагітність (за допомогою тесту та самостійного повідомлення); поширеність інших ІПСШ (шляхом тестування та самоповідомлення); знання та ставлення, пов'язані з проблемами сексуального та репродуктивного здоров'я; самостійна поведінка сексуального ризику, включаючи сексуальний дебют під час спостереження за випробуваннями, використання презервативів, кількість сексуальних ризиків партнерів, користування медичними послугами, якщо повідомили про потенційні ІПСШ. | У школі під керівництвом вчителів і peer-assisted programme.Covered відмова, самоефективність, самооцінка, ІПШ/ВІЛ, сексуальність, контрацепція, соціальні цінності, повага, gender.Used драма, історії та games.Also включали втручання, щоб зробити державні медичні послуги більш дружніми до молоді, просування молодіжних презервативів та розподіл та обмежені інтервенції спільноти. Десять-15 уроків на рік протягом 3 років. |
Адаптовано з дозволу Журналу здоров'я підлітків, Том 49, випуск 6, Napierala Mavedzenge et al., Профілактика ВІЛ у молоді в Африці на південь від Сахари: систематичний огляд, стор. 568—86, Авторське право © 2011Суспільство здоров'я та медицини підлітків. Опубліковано Elsevier Inc. всі права захищені. < http://www.sciencedirect.com/science/journal/1054139X >. Ця таблиця не поширюється на умови ліцензії Creative Commons цієї публікації. Для отримання дозволу на повторне використання, будь ласка, зв'яжіться з правовласником.
2.4 Оцінка ризику упередженості в дослідженнях
Після завершення опису кожного дослідження слід провести оцінку ступеня потенційного ухилу та помилки, які могли виникнути, або з проектування, або аналізу кожного з оригінальних досліджень. Основною метою цього є керівництво інтерпретацією висновків огляду. У деяких випадках може бути вирішено виключити дослідження, яке є недосконалим в тій мірі, в якій результати вважаються, ймовірно, не є дійсними. Крім того, аналіз чутливості може бути проведений для оцінки того, чим відрізняються підсумкові результати, якщо результати більш недосконалих досліджень включені або виключені.
Існує кілька методів оцінки ризику упередженості, включаючи контрольні списки або шкали «оцінки якості». Рекомендація Кокранівського співробітництва та вказівок PRISMA полягає у використанні «оцінки на основі домену», в якій критичні оцінки робляться для таких областей, як засліплення учасників та генерація випадкової послідовності (для рандомізованих досліджень) (Higgins and Green, 2008). Для спостережних досліджень існують додаткові можливі джерела упередженості. Наприклад, у кейс-контрольних дослідженнях слід проводити перевірку зовнішньої обґрунтованості вибору випадку, вибору контрольної групи та коригування на змішані фактори.
У таблиці 3.3 узагальнено деякі джерела потенційного зміщення в РКТ та спостережних дослідженнях.
Оцінка потенційних упереджень повинна бути адаптована до дослідницького питання. Для кожного огляду слід враховувати, чи є один потенційний упередження важливішим для інтерпретації висновків, ніж інші. Наприклад, якщо результат вимірюється об'єктивно (наприклад, смертність), то засліплення тих, хто оцінює результат, не буде дуже важливим. На відміну від цього, якщо втрата спостереження висока і пов'язана з результатом, то це може спричинити значну упередженість.
Таблиця, що підсумовує ризик упередженості в кожному дослідженні, повинна бути заповнена незалежно двома рецензентами, а будь-які відмінності узгоджуються шляхом обговорення або посилання на третього рецензента. Підведення підсумків можна зробити по-різному - деякі автори класифікують дослідження в порядку якості; інші поділяють їх на ті, що мають низький, середній або високий ризик упередженості. Ці рішення повинні бути прийняті незалежно від результатів досліджень, якщо це можливо, перед вивченням результатів, і рецензентам необхідно вирішити, які дослідження (якщо такі є) будуть передані на кількісний мета-аналіз висновків.
Таблиця 3.3 Методи оцінки ризику зміщення в РЧТ і спостережні дослідження
| Джерело упередженості | Визначення | Оцінка для RCT | Оцінка для спостережних досліджень |
|---|---|---|---|
| ухил вибору | Систематичні відмінності між групами порівняння | Генерація випадкового розподіленняПриховування розподілу | Вибір відкритого/невиставленогоВибір корпусів/елементів управління |
| Упередженість продуктивності | Систематичні відмінності в наданому догляді (крім втручання) | Осліплення учасника і провайдермісКласифікація впливу | Систематичні відмінності в тих, хто піддається і непіддаєтьсянеправильної класифікації впливу |
| ухил виснаження | Систематичні відмінності між групами порівняння при знятті коштів з дослідження | Дані про результати аналізу щодо наміру лікування доступні не для всіх учасників | Різні показники спостереження між викритими та неекспонованими (або коефіцієнтами участі у справах та контролі) |
| Виявлення ухилу | Систематична різниця в оцінці результатів | Засліплення тих, хто оцінює результат | |
2.5 Кількісний синтез результатів
2.5.1 Лісові ділянки
Після описового аналізу та оцінки ризику упередженості може бути доцільним проведення офіційного мета-аналізу, який кількісно визначає загальний ефект втручання. Якщо, наприклад, популяції, втручання та результати дослідження суттєво відрізнялися, автори можуть вирішити зосередитись на описі досліджень, їх результатів, застосовності та обмежень у розповідному огляді, а не виробляти кількісне резюме. Це було для систематичного огляду втручань у молоді в країнах Африки на південь від Сахари (Napierala Mavedzenge et al., 2011 ).
В інших випадках може бути корисним кількісно узагальнити дані. Першим кроком для цього є створення графіка, який називається ділянкою лісу, який відображає міру ефекту (наприклад, АБО) для кожного дослідження, разом з горизонтальною лінією, що позначає СІ. Перш ніж будувати такий графік, важливо врахувати, чи дійсно результати різних досліджень вимірюють один і той же ефект і порівнянні один з одним. Наприклад, втручання з припинення куріння може мати різний ефект у вагітних жінок, ніж серед дівчаток-підлітків. У таких випадках було б корисно представити результати, розшаровані за підгрупами, у яких можна очікувати відмінності ефектів. Як і всі аналізи, ці підгрупи повинні бути визначені заздалегідь і включені в протокол рецензування. Наприклад, в огляді жувальних речовин в Азії було вирішено апріорі стратифікувати за географічним регіоном, мінімізувати плутанину через наявність або відсутність тютюну в жувальних речовині, оскільки вважалося, що це відрізнялося між регіонами.
У цьому прикладі шість відповідних досліджень включали п'ять когортних досліджень та одне дослідження з контролю випадків. Ділянка лісу показаний на малюнку 3.2. Суцільна вертикальна лінія вказує на відносний ризик (RR) одного, що не представляє зв'язку між експозицією та результатом. У цьому прикладі всі шість досліджень мали RR більше одного, що свідчить про підвищений ризик ССЗ серед осіб, які вживали жувальні речовини, і 95% КІ не включали один на чотири з цих досліджень, що свідчить про вагомі докази асоціації. Лісова ділянка також включає загальну (зведену) оцінку РР. Це середньозважене значення ефектів від кожного з досліджень.
Існує два основних методи отримання підсумкової міри ефекту втручання. У моделі «фіксованих ефектів» передбачається, що справжній ефект впливу (або втручання) однаковий у кожному дослідженні, будь-яка варіація між дослідженнями відбувається виключно через випадковість. На відміну від цього, може бути використана модель «випадкових ефектів», в якій передбачається, що справжній ефект впливу для окремих досліджень за своєю суттю змінюється (наприклад, через відмінності в популяціях або залишкових заплутаних факторів). У моделі випадкових ефектів ваги дозволяють використовувати цю варіацію між дослідженням, а також випадкову варіацію.
На малюнку 3.2 була використана модель випадкових ефектів, а ваги для кожного дослідження наведені в правій частині ділянки лісу. Загальна (сумарна) оцінка RR = 1,26, при 95% ДІ 1,12-1,40. Зверніть увагу, що ця підсумкова оцінка є більш точною (тобто має більш вузький СІ), ніж будь-яке з окремих досліджень. Проводячи систематичний огляд та метааналіз, рецензенти тепер можуть повідомити, що є вагомі докази того, що в цих групах населення вплив жувальних речовин було пов'язане з підвищеним ризиком ССЗ приблизно на 26% порівняно з некористувачами.

Малюнок 3.2 Лісова ділянка для асоціації впливу жувальних речовин та ризику ССЗ в Азії.
Відтворено з Чжан, Л.Н. та ін., Жувальні речовини з тютюном або без нього та ризик серцево-судинних захворювань в Азії: мета-аналіз, Журнал університету Чжецзян Наука B, Том 11, випуск 9, стор. 681-9, Авторське право © Чжецзянський університет та Springer-Verlag Берлін Гейдельберг 2010, з дозволу Springer та Springer Science and Business Media. На це зображення не поширюються умови ліцензії Creative Commons цієї публікації. Для отримання дозволу на повторне використання, будь ласка, зв'яжіться з правовласником.
2.5.2 Вивчення неоднорідності
Розміри ефектів окремих досліджень неминуче будуть відрізнятися один від одного, але важливо оцінити, чи є ця різниця, ймовірно, пов'язана з випадковою варіацією (тобто справжній основний ефект буде однаковим) або реальними відмінностями в базових розмірах ефекту в індивідуальні дослідження. Тому важливо вивчити послідовність ефектів та кількісно оцінити неоднорідність (або різницю) розмірів ефектів між дослідженнями. Для цього доступні кілька заходів, одним з яких є статистика I 2 (Higgins et al., 2003 ). Ця статистика - це відсоток загальної варіації в дослідженнях, що пов'язано з неоднорідністю, а не випадковістю. Значення I 2 0% вказує на відсутність спостережуваної неоднорідності, а більші значення вказують на зростаючу неоднорідність. Основна перевага статистики I 2 полягає в тому, що вона не залежить від кількості досліджень, включених до мета-аналізу, і тому може використовуватися навіть для мета-аналізів, що містять відносно мало досліджень, які, як правило, мають низьку потужність для виявлення неоднорідності за допомогою інших заходів.
У нашому прикладі значення I 2 становить 35,9%, при p-значенні 0,17, що вказує на незначні докази неоднорідності. Тому рецензенти були обґрунтовані при поданні підсумкової оцінки. Якщо, навпаки, статистика I 2 передбачає докази неоднорідності, наприклад, якщо I 2 становив 70%, буде потрібно подальше дослідження причин неоднорідності, наприклад, шляхом проведення (заздалегідь визначеного) підгрупового аналізу. Якби більше не було доказів неоднорідності всередині підгруп, це вказувало б на те, що стратифікаційні характеристики є важливим джерелом неоднорідності, і результати повинні бути представлені в підгрупах, а не в цілому.