1.7: заплутаний
- Page ID
- 105362
Цілі навчання
Прочитавши цю главу, ви зможете зробити наступне:
- Поясніть поняття плутанини, і як воно впливає на результати епідеміологічних досліджень
- Повторюйте критерії, яким повинна відповідати змінна, щоб бути можливим співзасновником
- Проведіть стратифікований аналіз, щоб визначити, чи є змінна співзасновником
- Наведіть приклади взаємозв'язків викриття/результат/співзасновника з точки зору критеріїв співтовариства та вимог до аналізу
Як і випадкова помилка та упередженість, плутанина є ще однією загрозою для вивчення дійсності. Дійсно, є деякі тексти, i (p.37), а також документи, ii які посилаються на плутанину як «заплутаний упередженість». Я віддаю перевагу терміну заплутаний, без слова упередженість, оскільки, хоча це також призводить до систематичної помилки в даних, заплутаність - це особливий випадок.
Уявіть, що ви робите поперечне дослідження у дітей молодшого шкільного віку розміру стопи та здатності до читання:

На словах, чи впливає розмір стопи на здатність до читання?
Ви ходите до початкової школи і вимірюєте як розмір стопи (вимірюється як довжина в дюймах), так і здатність до читання (вимірюється з точки зору слів, прочитаних за хвилину, в середньому протягом 5-хвилинного періоду тестування), і ви збираєте наступні дані:
# учасника | Розмір стопи (дюйми) | Швидкість читання (Wpm) |
---|---|---|
1 | 7.2 | 40 |
2 | 7.7 | 85 |
3 | 7.2 | 63 |
4 | 7.6 | 52 |
5 | 7.4 | 51 |
6 | 7.1 | 41 |
7 | 7.0 | 82 |
8 | 7.2 | 60 |
9 | 7.6 | 53 |
10 | 7.5 | 55 |
11 | 8.3 | 123 |
12 | 8.2 | 97 |
13 | 8.5 | 108 |
14 | 8.1 | 111 |
15 | 8.2 | 109 |
16 | 8.2 | 99 |
17 | 8.7 | 95 |
18 | 8.0 | 110 |
19 | 8.5 | 121 |
20 | 8.2 | 108 |
21 | 9.4 | 128 |
22 | 8.1 | 117 |
23 | 9.8 | 115 |
24 | 8.8 | 109 |
25 | 9.1 | 112 |
26 | 9.3 | 112 |
27 | 9.8 | 106 |
28 | 9.2 | 125 |
29 | 9.6 | 163 |
30 | 9.0 | 137 |
Як обговорювалося в розділі 4, у цій книзі ми завжди будемо дихотомізувати (тобто розділити на дві частини) безперервні змінні, щоб зробити математику простішою. Якщо ми дихотомізуємо як розмір стопи, так і швидкість читання - на 8.25» та 100 wpm відповідно [1] - ми можемо намалювати наступну таблицю 2 х 2:
Швидкість читання | |||
<100 | 100+ | ||
Розмір стопи | <8.25″ | 12 | 5 |
8.25″+ | 1 | 12 |
Оскільки це дослідження поперечного перерізу, ми б розрахували коефіцієнт шансів:
На словах,
Ого! Це величезна знахідка! Чи повинні ми давати всім школярам гормони росту, щоб вони стали більшими ногами і збільшували швидкість читання?
Не так швидко.
Враховуючи, що цільовим населенням для цього гіпотетичного дослідження є школярі класу, здається імовірним, що на роботі є співзасновник, а саме клас. Діти у вищих класах матимуть більші ноги, тому що вони старші, і вони також за великим рахунком будуть швидшими читачами:

У цьому сценарії нам потрібно контролювати confounder (рівень класу): нам потрібно зняти його вплив, щоб отримати точну оцінку зв'язку між експозицією (розмір стопи) і результатом (здатність читання).
Перш ніж ми заглибимось у те, як контролювати для конфаундерів, давайте обговоримо, що таке змішувачі з теоретичної точки зору.
Критерії для Конфундерів
Є 3 критерії, яким повинна відповідати змінна, щоб вона була потенційним співзасновником (я кажу «потенціал», оскільки не всі змінні, які відповідають цим критеріям, насправді виявляться заплутаними даними - ви зрозумієте це під час аналізу):
- Змінна повинна бути статистично пов'язана з експозицією.
- Змінна повинна викликати результат.
- Змінна не повинна знаходитися на причинно-наслідковому шляху.
Давайте обговоримо кожну з них докладніше.
Критерій #1: Пов'язаний з експозицією
Асоціація - це статистичний термін, який не обов'язково має на увазі причинно-наслідковий зв'язок (про це докладніше мова далі, див. Главу 10). В основному асоціація означає, що змішана змінна частіше зустрічається в експонованій групі, ніж неекспонована група (або навпаки), створюючи таким чином статистичну асоціацію. Конфаундер не повинен викликати або запобігати впливу, його просто потрібно непропорційно розподілити між оголеними та неекспонованими групами. У нашому попередньому прикладі рівень класів непропорційно розподілений між різними розмірами стопи - діти у вищих класах частіше мають більші ноги порівняно з дітьми молодших класів. Зауважте, що може існувати причинно-наслідковий зв'язок, коли співзасновник спричиняє експозицію (але не навпаки - див. Критерій 3), але це не обов'язково. У нашому прикладі рівень класу не спричиняє розмір стопи (вік спричиняє розмір стопи), але вони пов'язані.
Критерій #2: Причини результату
При цьому повинна бути причинно-наслідковий зв'язок між змішником і результатом. Це не повинно бути доведеним причинним зв'язком, просто «цілком можливо, що ця експозиція спричиняє (або запобігає) цьому результату» посилання. У нашому прикладі розміру стопи/здатності до читання рівень класу (співзасновник), безумовно, спричиняє швидшу швидкість читання (результат).
Важливо, що співзасновник повинен спричинити результат, а не навпаки. Якщо результат викликає співзасновника, то це не співзасновник. Є багато разів в епідеміології, коли ми не впевнені, яким шляхом піде причинна стрілка - чи викликає хвороба співзасновника, чи співзасновник викликає хворобу? Прикладом може бути надмірна втрата ваги і хвороби. Швидка втрата великої кількості ваги може зробити одну хворобу, але захворіти також може спричинити велику кількість втрати ваги. У таких сценаріях, де ми не впевнені, на який бік вказує стрілка, те, що епідеміологи роблять на практиці, спочатку припускають, що стрілка йде в один бік і зробити аналіз відповідно (тут, це означало б або включаючи потенційного співзасновника). Потім вони припускають, що стрілка йде іншим шляхом і знову роблять аналіз. Якщо результати обох аналізів схожі, то напрямок стрілки не має значення. Але якщо 2 аналізи дають дуже різні результати, то ми б повідомляли про обидва і дозволили читачеві вирішити, який для них більш застосовний.
Критерій #3: Не на причинному шляху
Остаточним критерієм того, щоб змінна була потенційним спотворником, є те, що вона не знаходиться на причинно-наслідковому шляху від впливу до результату. Іншими словами, ми не хочемо такого сценарію:

Приклад змінної на причинно-наслідковому шляху може бути наступним:

У цьому випадку «настороженість у класі» не є змішником, оскільки це викликано кількістю сну і, таким чином, знаходиться на причинному шляху. Змінні на причинному шляху є медіаторами, а не потенційними заплутаними.
Плутанина: визначення
Таким чином, співзасновник - це третя змінна, а не експозиція, а не результат [2] - яка зміщує міру асоціації, яку ми обчислюємо для конкретної пари експозиції/результат.
Важливо, що з точки зору досліджень, ми ніколи не хочемо повідомляти про міру асоціації, яка є плутаною. Уявіть собі, якщо ми проведемо наше поперечне дослідження розміру стопи та здатності до читання, не враховуючи рівень оцінки. Ми б повідомили про коефіцієнт шансів 28.8, як розраховано вище... Упс! Ми повідомили про асоціацію, яка насправді не відповідає дійсності - це просто плутається рівнем класів.
Методи контролю конфоундерів
Можна контролювати для плутанини за допомогою або дослідження дизайну або аналітичних методів. З точки зору дизайну дослідження, ви можете
- Обмеження зразка
- Матч на співзасновника
- Рандомізувати (як у, вибрати рандомізоване контрольоване дослідження як дизайн дослідження)
Обмеження вибірки означає, що ви обмежуєте своє навчання лише одним рівнем співзасновника (наприклад, лише для третіх класів). Тому потенційно заплутана змінна більше не відповідає першому критерію для конфаундерів - вона не може бути непропорційно розподілена між виставленими та неекспонованими, оскільки доступний лише один рівень співзасновника. Таким чином, усі викриті учасники перебувають у третьому класі, як і всі неекспоновані. Наша причинно-наслідкова діаграма тепер виглядає так:

Обмежуючись лише одним рівнем класу, ми видаляємо плутанину за рівнем класів: діти як у вищих, так і в молодших класах більше не актуальні, тому що якщо у нас є лише третіх класів, то немає дітей у вищих чи молодших класах. Серед лише третіх класів ми очікуємо, що розмір стопи та здатність до читання не співвідносяться.
властива мінливість
Очевидно, що не всі третіх класи матимуть ноги однакового розміру, а також усі третікласники рівномірно матимуть однакову здатність до читання. Однак на груповому рівні третіх класів взагалі мають більші ноги і є кращими читачами, ніж першокласники, а також мають менші ноги і бідніші читачі, ніж п'ятикласники. Епідеміологія як наука працює через як цю індивідуальну варіацію, так і через те, що групи людей (відібрані за якоюсь характеристикою, як рівень класів) більше схожі один на одного, ніж люди в інших групах.
Ось ті самі дані зі стовпцем, доданим для рівня оцінки:
# учасника | Розмір стопи (дюйми) | Швидкість читання (Wpm) | Сорт |
---|---|---|---|
1 | 7.2 | 40 | 1 |
2 | 7.7 | 85 | 1 |
3 | 7.2 | 63 | 1 |
4 | 7.6 | 52 | 1 |
5 | 7.4 | 51 | 1 |
6 | 7.1 | 41 | 1 |
7 | 7.0 | 82 | 1 |
8 | 7.2 | 60 | 1 |
9 | 7.6 | 53 | 1 |
10 | 7.5 | 55 | 1 |
11 | 8.3 | 123 | 3 |
12 | 8.2 | 97 | 3 |
13 | 8.5 | 108 | 3 |
14 | 8.1 | 111 | 3 |
15 | 8.2 | 109 | 3 |
16 | 8.2 | 99 | 3 |
17 | 8.7 | 95 | 3 |
18 | 8.0 | 110 | 3 |
19 | 8.5 | 121 | 3 |
20 | 8.2 | 108 | 3 |
21 | 9.4 | 128 | 5 |
22 | 8.1 | 117 | 5 |
23 | 9.8 | 115 | 5 |
24 | 8.8 | 109 | 5 |
25 | 9.1 | 112 | 5 |
26 | 9.3 | 112 | 5 |
27 | 9.8 | 106 | 5 |
28 | 9.2 | 125 | 5 |
29 | 9.6 | 163 | 5 |
30 | 9.0 | 137 | 5 |
Обмежуючись лише третім класом, то таблиця 2 х 2 виглядає так:
Швидкість читання | |||
<100 | 100+ | ||
Розмір стопи | <8.25″ | 2 | 2 |
8.25″+ | 3 | 3 |
Коефіцієнт коефіцієнта (АБО) дорівнює 1.0. Це правильна міра асоціації, щоб повідомити. Насправді розмір стопи не має нічого спільного зі швидкістю читання (АБО 1.0). 28,8, який ми розрахували раніше, був неправильним. Це було збентежено рівнем класів - немає асоціації, коли ми контролюємо цю плутанину, обмежуючись одним рівнем класу.
Хоча обмеження прекрасно працює з точки зору контролю плутанини, часто це не є реалістичним підходом, оскільки воно занадто обмежує наше дослідження. Наприклад, розумним дослідницьким питанням може бути: «Які предиктори смерті від раку молочної залози серед жінок в постменопаузі?» Обмеження за віком (наприклад, «Які предиктори смерті від раку молочної залози серед 62-річних жінок?») зробить дослідження набагато менш корисним, тому що ми не обов'язково зможемо узагальнити результати для жінок іншого віку. Таким чином, епідеміологи зазвичай використовують інші підходи для контролю над конфоундерами.
Відповідність часто використовується в дослідженнях кейс-контролю, і це має приблизно такий же ефект, як обмеження в контролі плутанини. Наприклад, скажімо, ми дивимося на певний вроджений дефект (результат) і материнське куріння (вплив), і ми підозрюємо, що материнський вік є можливим співрозмовником. Ми хотіли б набрати контроль з однаковим віком матері для кожного випадку: якби дослідження було зараховано 30-річну справу, ми хотіли б поєднати її з 30-річним контролем. Конфаундер (вік) все ще спричиняє результат (вроджені дефекти), але, змушуючи розподіл конфаундера бути однаковим між випадками та контролями, ми заперечували критерій #2, і, таким чином, заперечували можливий вплив конфаундера на показник експозиції/результату асоціації.
Рандомізація працює, змушуючи співзасновника (ів) провалитися критерій # 1 - у цьому випадку шляхом випадкового призначення учасників експозиції, ми забезпечили рівний розподіл конфаундера між виставленими та неекспонованими групами. Зв'язок між співзасновником і експозицією тепер відсутній, як це з обмеженням. Докладніше про це див. розділ 9.
З точки зору контролінгу для плутанини в фазі аналізу існує 2 основних варіанти:
- розшарування
- Регресія (що насправді є лише особливим випадком розшарування)
Щоб стратифікувати, ви берете дані та складаєте іншу таблицю 2 х 2 для кожного рівня потенційного співзасновника. Давайте тепер припустимо, що нас турбують дані дослідження кейс-контролю щодо використання оральних контрацептивних таблеток (OCP) (коли-небудь використовуваних проти ніколи не використовуваних) та раку яєчників:

Проводимо це дослідження і отримуємо наступні дані:
# учасника |
Коли-небудь OCP? 0 = ні, 1 = так |
Рак яєчників? 0 = ні (контроль), 1 = так (випадок) |
---|---|---|
1 | 1 | 1 |
2 | 1 | 1 |
3 | 1 | 1 |
4 | 1 | 1 |
5 | 0 | 1 |
6 | 0 | 1 |
7 | 0 | 1 |
8 | 0 | 1 |
9 | 0 | 1 |
10 | 0 | 1 |
11 | 1 | 0 |
12 | 1 | 0 |
13 | 1 | 0 |
14 | 1 | 0 |
15 | 0 | 0 |
16 | 0 | 0 |
17 | 0 | 0 |
18 | 0 | 0 |
19 | 0 | 0 |
20 | 0 | 0 |
Таблиця 2 х 2 буде такою:
Рак яєчників | |||
+ | — | ||
OCP | коли-небудь | 4 | 4 |
Ніколи | 6 | 6 |
АБО становить 1,0 - використання оральних контрацептивів не пов'язане з раком яєчників. Під час змішаних аналізів це значення називається сирої або нескоригованою мірою асоціації - це означає, що ми ще не врахували, не скоригували або контролювали для будь-яких змішників. Нескориговані заходи враховують лише експозицію та результат.
Однак як щодо куріння як співзасновника? Давайте перевіримо критерії confounder:
- Змінна повинна бути пов'язана з експозицією.
- Так! Як оральні контрацептиви, так і куріння збільшують ризик тромбозу глибоких вен, потенційно небезпечного для життя стану. Таким чином, куріння вважається протипоказанням до використання оральних контрацептивів, iii що змушує клініцистів призначати інші форми контролю над народжуваністю замість жінок, які палять. Це призводить до непропорційного розподілу курців (співзасновника) між жінками, які роблять і не використовують оральні контрацептиви (вплив).
- Змінна повинна викликати результат.
- Можливо. Хоча ми часто думаємо про куріння як спричинення раку легенів (що це, безумовно, робить), куріння також було пов'язано з іншими видами раку досить часто, що розумно підозрювати, що це може спричинити рак яєчників теж. iv
- Змінна не повинна знаходитися на причинно-наслідковому шляху.
- Так! Здається вкрай малоймовірним, що прийом протизаплідних таблеток, у свою чергу, змусить жінку зайнятися курінням.
Таким чином, куріння відповідає нашим критеріям і є потенційним співрозмовником у цьому сценарії. [3] Ось дані з доданими статусом куріння:
# учасника | Коли-небудь OCP?
0 = ні, 1 = так |
Рак яєчників?
0 = ні (контроль), 1 = так (випадок) |
Курець?
0 = ні, 1 = так |
---|---|---|---|
1 | 1 | 1 | 1 |
2 | 1 | 1 | 1 |
3 | 1 | 1 | 0 |
4 | 1 | 1 | 0 |
5 | 0 | 1 | 1 |
6 | 0 | 1 | 1 |
7 | 0 | 1 | 1 |
8 | 0 | 1 | 0 |
9 | 0 | 1 | 0 |
10 | 0 | 1 | 0 |
11 | 1 | 1 | 1 |
12 | 1 | 0 | 1 |
13 | 1 | 0 | 0 |
14 | 1 | 0 | 0 |
15 | 0 | 0 | 1 |
16 | 0 | 0 | 1 |
17 | 0 | 0 | 1 |
18 | 0 | 0 | 0 |
19 | 0 | 0 | 0 |
20 | 0 | 0 | 0 |
Тепер ми стратифікуємо за статусом куріння. Іншими словами, робимо 2 різних столу 2 × 2: один для курців, а інший для некурящих. Майте на увазі, що всі жінки, які з'явилися у вищезгаданій таблиці 2 × 2 для раку яєчників та використання OCP, все ще присутні - вони знаходяться лише в одній з двох таблиць нижче, залежно від того, курять вони чи ні.
Рак яєчників | |||
+ | — | ||
OCP | коли-небудь | 2 | 3 |
Ніколи | 3 | 2 |
Рак яєчників | |||
+ | — | ||
OCP | коли-небудь | 2 | 3 |
Ніколи | 3 | 2 |
Зверніть увагу, що таблиці 2 x 2 все ще призначені для OCP (опромінення) та раку яєчників (результат) - ми щойно зробили одну таку таблицю для курців, а іншу для некурящих.
Наступним кроком стратифікованого аналізу є обчислення ОР з цих таблиць 2 х 2, тому у нас є АБО для курців, і OR для некурящих.
Плутаний приклад 1: OCP/рак яєчників за статусом куріння
Приклад\(\PageIndex{1}\)
Коефіцієнт шансів для курців становить:
Тлумачення:
Жінки, які мають рак яєчників, в 0.44 рази частіше повідомляють про історію використання OCP, порівняно з жінками без раку яєчників - лише серед курців.
А коефіцієнт шансів для некурящих становить:
Тлумачення:
Серед некурящих жінок, які мають рак яєчників, у 0,44 рази частіше повідомляють про використання оральних контрацептивів (OCP) в анамнезі порівняно з жінками без раку яєчників.
Зверніть увагу на доповнення (червоним кольором) до цих тлумачень! При проведенні стратифікованого аналізу важливо сказати, до якої групи відноситься ваша міра асоціації. Це може наступити або на початку (як це робиться вище для некурящих), або в кінці (як це робиться вище для курців).
Оскільки наші коефіцієнти шансів (0,44 для курців та 0,44 для некурящих) схожі один на одного, але відрізняються від сирої АБО (яка була 1,0), ми говоримо, що куріння дійсно діє як співзасновник у цих даних. Сира АБО була неправильна; це було заплутано курінням.
«Схожі» і «різні» —за скільки?
Коли заходи асоціації, специфічні для шарів, схожі один на одного, але відрізняються від сирої АБО, ми заплуталися. Але на скільки? Існує стандартний критерій для «різних» - якщо сирі та скориговані ОР відрізняються більше ніж на 10%, більшість епідеміологів вважають це доказом плутанини. Для «подібного», хоча, насправді немає консенсусу. Можливо, в межах 2— 3% один від одного? Важливо, що вартість сирої сировини не потрапляє між ними.
Коли заходи асоціації, специфічні для шарів, схожі один на одного, але відрізняються від сирої АБО, ми заплуталися. Але на скільки? Існує стандартний критерій для «різних» - якщо сирі та скориговані ОР відрізняються більше ніж на 10%, більшість епідеміологів вважають це доказом плутанини. Для «подібного», хоча, насправді немає консенсусу. Можливо, в межах 2— 3% один від одного? Важливо, що вартість сирої сировини не потрапляє між ними.
«Справжнє» АБО становить 0,44: використання оральних контрацептивів досить сильно пов'язане з меншим раком яєчників. Але без обліку куріння це виглядає так невірно (сире АБО було 1,0, і не контролювало куріння). Оскільки існує плутанина, ми, таким чином, хотіли б повідомити про АБО, що контролює куріння (співзасновник). Найпоширеніший спосіб зробити це - розрахувати «скориговану» міру. Існує багато способів обчислити скориговану міру асоціації [4]; один - розрахувати коефіцієнт Мантеля-Хаензеля:
\[\widehat{O R_{M H}}=\frac{\sum_{i=1}^{k}\left(\frac{a_{i} d_{i}}{n_{i}}\right)}{\sum_{i=1}^{k}\left(\frac{b_{i} c_{i}}{n_{i}}\right)}\]
де\(n_{i}=a_{i}+b_{i}+c_{i}+d_{i}\)
З формули видно, що Mantel-Haenzel OR є лише середньозваженим співвідношенням шансів, специфічних для шару, причому кожен шар є i. Ми називаємо це скоригованим АБО, і він контролюється для плутанини змінної, на якій ми стратифіковані.
Категоризація безперервних змінних
Я згадав у розділі 4, що якщо один має безперервну змінну (наприклад, вік або зріст), більшість аналізів найкраще обслуговуються, зберігаючи цю змінну безперервно, але що для цілей цієї книги, ми б дихотомізувати всі змінні, щоб полегшити математику. Якщо потенційний співзасновник є безперервною змінною, ми повинні класифікувати її (зазвичай на 2 або 3 категорії), щоб провести стратифікований аналіз вручну. Таким чином, якби висота була нашим потенційним співзасновником, ми могли б створити 3 категорії: менше 5′2″, 5′2″—6′0″ і вище, ніж 6'0″. Однак ви можете бачити, що в цих категоріях все ще існує значна мінливість - 5′2 ″ - це повний 10 ″ коротший, ніж 6 ′. Таким чином, створення категорій (тобто шарів для стратифікованого аналізу) з безперервної змінної для управління заплутанням може не працювати ідеально, якщо шари залишаються занадто неоднорідними. Це призводить до залишкового плутанини - ми видалили частину заплутаних по висоті, але все ще є деякі заплутані ліворуч. Це одна з причин епідеміологів в основному стрибають прямо до регресії, в якій легше тримати безперервні змінні безперервними. Однак мета цієї книги полягає в тому, щоб створити обізнаних читачів епідеміологічних досліджень, а не обізнаних виконавців, що значно більше навчання. Таким чином, я покладаюся на категоризацію безперервних змінних, щоб математика була легко слідувати, а статистичне програмне забезпечення є непотрібним. Якщо ви будете дотримуватися математики, представленої тут, досить легко зробити когнітивний стрибок до читання статей, які використовують регресію (регресія - це просто стратифікований аналіз з багатьма іншими категоріями).
Більшість досліджень, про які повідомляється в літературі, використовують інший метод контролю для плутанини в аналізах: регресія, яка є лише окремим випадком стратифікованого аналізу - зокрема, він враховує всі можливі верстви. Наприклад, якби ми мали безперервні дані про загальні місяці куріння протягом усього життя, регресійна модель «зробила» таблицю 2 × 2 для некурящих, тоді одна для людей курила протягом 1 місяця, потім таблиця 2 × 2 для тих, хто курив протягом 2 місяців, і так далі, поки кожен можливий шар не мав своїх 2 × Таблиця 2. Потім модель обчислює середньозважене загальне значення їх загальної кількості (подібно до мега-камінного Haenzel), і результат також відомий як скоригований коефіцієнт коефіцієнта. Для когортних досліджень або рандомізованих контрольованих випробувань ми, звичайно, замість цього розраховуємо скоригований коефіцієнт ризику або скоригований коефіцієнт швидкості (RR).
Тлумачення
Щоб інтерпретувати наші результати раку OCP/яєчників словами (скоригований коефіцієнт шансів, розрахований за допомогою Мантеля-Хейнзеля або регресії, становить 0,44), ми б сказали:
Або ми могли б сказати:
Або ми могли б сказати:
Зверніть увагу, як існує кілька способів повідомити читача про те, що куріння трактувалося як співзасновник (фрази червоним кольором). Не має значення, що ви виберете - важливо те, що ви даєте зрозуміти, що ми представляємо міру асоціації, вже розібравшись із заплутаним.
Вибір Конфундерів
При проведенні аналізу в реальному житті часто виникають множинні потенційні плутанини. Першим кроком будь-якого аналізу є складання списку всіх таких потенційних плутанин. Найпростіший спосіб зробити це - спочатку скласти список всіх змінних, які можуть викликати ваш результат. Потім візьміть цей список і переконайтеся, що змінні пов'язані з експозицією. Нарешті, для будь-яких змішників, які відповідають нашим першим 2 критеріям, переконайтеся, що вони не знаходяться на причинно-наслідковому шляху (наприклад, що вплив не викликає співзасновника). Як згадувалося вище, є багато випадків, коли важко знати, що викликає, що; у таких випадках ми робимо аналіз обома способами.
Наступним кроком буде визначення того, хто з потенційних змішників відповідає 3 критеріям, які слід контролювати в аналізі (регресія дозволяє контролювати відразу для багатьох змішників). Одним із способів було б відмовитися від усіх змішників, які не відповідають критерію «10% зміни», згаданому вище. Однак є додаткові нюанси, які виходять за рамки цієї книги, і видатні епідеміологи розходяться в думках про те, як вибрати список плутанин для контролю. v, vi, vii На щастя, початківцям студентам епідеміології не потрібно буде проводити власний складний аналіз; однак, можливість продумати конкретні відносини впливу та захворювання та скласти список усіх потенційних плутанів є корисним навиком при читанні літератури. Чи вважали автори всі змінні, про які ви думали, що відповідають критеріям confounder? Якщо ні, то вони прямо вказували чому ні? Якщо очевидний потенційний співзасновник відсутній в аналізі в конкретній статті, то, можливо, це не найвірніша стаття.
Резюме
Конфаундери - це змінні, а не експозиція, а не результат - які впливають на дані небажаним та непередбачуваним способом. Зокрема, в даних, які плутаються, можна буде обчислити невірну міру асоціації (і неможливо знати, в якому напрямку помиляється). Це призводить до неточних висновків, якщо ніхто не контролює цього співзасновника. Щоб бути потенційним співзасновником, змінна повинна бути статистично пов'язана з експозицією, повинна спричинити результат і не повинна бути на причинному шляху. Потенційні плутанини можуть контролюватися за допомогою дизайну дослідження (обмеження, узгодження або рандомізація) або під час аналізу даних (стратифікація або регресія, що призводить до скоригованої міри асоціації). В останньому випадку, якщо сирі та скориговані оцінки об'єднання відрізняються більше ніж на 10%, змінну слід вважати співзасновником, і можна повідомити про скориговану оцінку, оскільки вона контролює співзасновника.
Посилання
i. останній Д.М. Словник епідеміології. 4-е видання 2001 р. Нью-Йорк: Преса Оксфордського університету. (← Повернення)
II. Гольдштейн Б.А., Бхавсар Н.А., Фелан М., Пенчіна М.Дж. Контроль за інформованим зміщенням присутності через кількість зустрічей зі здоров'ям в електронній медичній картці. Епідеміологія Я. 2016; 184 (11) :847-855. дої:10.1093/адже/kww112 (↑ Повернення)
iii. Боннема РА, Макнамара MC, Спенсер AL. Вибір контрацепції у жінок з основними захворюваннями. Лікар Ам Фам. 2010; 82 (6) :621-628. (Повернення)
IV. Дослідження: Куріння спричиняє майже половину смертей від 12 типів раку. Американське онкологічне товариство. https://www.cancer.org/latest-news/s...cer-types.html. Доступ до 21 жовтня 2018 р. (← Повернення)
проти Гренландії S, Перл Дж., Робінс Дж. Причинно-наслідкові діаграми для епідеміологічних досліджень. Епідеміальний табір Мас. 1999; 10 (1) :37-48.
vi. Харрелл FEJ. Стратегії регресійного моделювання з додатками до лінійних моделей, логістичної регресії та аналізу виживання. Нью-Йорк: Спрінгер; 2001. (← Повернення)
vii. Selvin S. Статистичний аналіз епідеміологічних даних. 3-е изд. Оксфорд: Преса Оксфордського університету; 2004. (← Повернення)
- Відсічення 8.25» та 100 wpm було б чудовою річчю, щоб варіюватися в аналізі чутливості! Див. Розділ 6. ←
- Просто нагадування! Коли епідеміологи кажуть, що результат ми маємо на увазі «результат здоров'я або досліджуване захворювання» - ми не маємо на увазі результати дослідження. Це результати. Див. Додаток 1. ←
- Пам'ятайте, змінні, які відповідають критеріям confounder, є потенційними змішувачами. Вони можуть або не можуть фактично виробляти упереджену оцінку асоціації; ми з'ясуємо це під час аналізу. ←
- Будь-який текст біостатистики обговорював би кілька таких методів. ←