1.6: Упередженість
- Page ID
- 105374
Цілі навчання
Прочитавши цю главу, ви зможете зробити наступне:
- Визначте зміщення та відрізніть його від випадкової помилки
- Розмежуйте різні типи упередженості, загальні для епідеміологічних досліджень, та надайте наочні приклади кожного
Як ми дізналися в попередньому розділі, випадкова помилка існує у всіх дослідженнях, оскільки вона існує певною мірою у всіх вимірах. Стандартні статистичні методи використовуються для кількісної оцінки випадкової помилки та ролі, яку вона може відігравати або не грати в інтерпретації результатів дослідження. Випадкові помилки не можуть бути усунені повністю, і, правильно інтерпретуючи p -значення і довірчі інтервали (CI), ми можемо розмістити наші результати у відповідному контексті.
З іншого боку, упередженість стосується систематичних помилок, що означає, що вони непропорційно впливають на дані лише в одному напрямку - тому, наприклад, ми завжди недооцінюємо або завжди переоцінюємо при різанні 6 столових ложок вершкового масла для нашого торта (див. Розділ 5). Існує багато потенційних джерел упередженості в епідеміологічних дослідженнях; тут ми розглянемо деякі з найпоширеніших. Як і при випадковій помилці, всі дослідження містять певну ступінь упередженості, і, як і при випадковій помилці, ми робимо все можливе, щоб мінімізувати її. Різниця полягає в тому, що статистичні методи не можуть допомогти нам з упередженістю.
Упередженість призводить до розрахункової міри асоціації, яка або вище, або нижче того, що вона «повинна» бути, оскільки наші дані були перекошені в ту чи іншу сторону. Неможливо дізнатися величину ухилу або навіть напрямок. Чи ми перевищили чи недооцінювали коефіцієнт ризику (RR)? За скільки? Ми ніколи не дізнаємося відповідей на ці питання, але, продумуючи ймовірні напрямки систематичних помилок (наприклад, люди, як правило, переоцінюють, скільки вправ вони отримують), ми часто можемо робити освічені здогадки про напрямок упередженості і, можливо, також його величину. Але вони тільки припущення.
Упередженість можна мінімізувати за допомогою правильного дизайну дослідження та методів вимірювання, але його ніколи не можна повністю опустити. Усі дослідження мають упередженість, оскільки люди залучені, а люди за своєю суттю упереджені. i Хороші вчені будуть обмірковувати потенційні джерела упередженості на етапах планування дослідження, працюючи над їх мінімізацією. Вони також зроблять чесну оцінку залишкового упередженості в кінці дослідження та обговорять це в розділі обмежень розділу обговорення статті (див. Додаток 1).
Внутрішня і зовнішня дійсність
Упередженість може впливати як на внутрішню валідність, так і на зовнішню обґрунтованість дослідження. Перше - питання куди більш серйозне. Внутрішня валідність стосується внутрішньої роботи дослідження: Чи використовувався найкращий дизайн? Чи були змінні виміряні розумним способом? Чи провели автори правильний набір аналізів? Зауважте, що хоча ми не можемо виміряти або кількісно оцінити внутрішню обґрунтованість, розуміння епідеміології та біостатистики дозволяє якісно оцінювати. Ми можемо повірити, що результати дослідження, яке, здається, є внутрішньо дійсним. Однак дослідження, яке має основні методологічні проблеми, не має внутрішньої обґрунтованості, і ми, мабуть, не повинні приймати результати.
Якщо дослідження не вистачає внутрішньої обґрунтованості, припиніть. Рідко виникає необхідність в його подальшій оцінці. З іншого боку, якщо дослідження, здається, має внутрішню обґрунтованість, ми оцінюємо зовнішню валідність або узагальнюваність. Зовнішня валідність стосується того, наскільки добре результати цього конкретного дослідження можуть бути застосовані до більшої кількості населення. Нагадаємо з глави 1, що цільова популяція - це група, про яку ми хочемо щось сказати, використовуючи дані, зібрані з нашої вибірки. Іноді ми знаходимо внутрішньо дійсне дослідження, тобто воно проводилося цілком правильним чином, але чомусь вибірка недостатньо репрезентативна для цільової групи. Наприклад, під час дисертаційної роботи я використовувала когортні дані для оцінки впливу фізичної активності матері під час вагітності на різні результати пологів. ii Дані надходили з великої когорти вагітності та включали дані про сотні експозицій та десятки результатів. iii Критерії включення були поблажливими - всі жінки, вагітні однотонним плодом, які планували пологи в певній лікарні, мали право. Подібно до того, як ми знаходимо в загальній популяції, вагітні люди в цій когорті були переважно малорухливими. ІІ, IV
У деяких останніх роботах я розглядав конкретно фізичні навантаження під час вагітності як єдине опромінення; таким чином, моя реклама про залучення жінок до дослідження згадувала, що я вивчаю фізичні вправи під час вагітності (а не вагітність взагалі). [1] У цьому недавньому дослідженні у мене було дуже мало сидячих людей - справді, у мене є декілька, хто повідомив про біг півмарафонів під час вагітності! Оскільки це не нормально, моє дослідження - хоча воно має розумну внутрішню дійсність - не може бути узагальнено для всіх вагітних жінок, а лише для субпопуляції з них, які отримують неабияку фізичну активність. У ньому відсутня зовнішня валідність. Оскільки він має хорошу внутрішню валідність, я можу узагальнити результати для високоактивних вагітних жінок - тільки не для всіх вагітних жінок.
репрезентативність зразків
Якщо у вас є вибірка, яка не є репрезентативною для основної популяції, це впливає на зовнішню валідність. Те, наскільки це викликає занепокоєння, однак, залежить від питання дослідження. Питання, які стосуються головним чином біології (наприклад, чи знижують статини рівень холестерину в сироватці крові?) не обов'язково вимагають репрезентативних зразків, тому що фізіологія зазвичай не сильно змінюється між людьми з різними демографічними характеристиками (відмінності за статтю є єдиним винятком): мій організм, ймовірно, обробляє статинові препарати майже ідентично, ніж більшість інших жінок. Однак, коли питання дослідження стосується поведінки, то ми повинні бути дуже стурбовані репрезентативністю, оскільки поведінка сильно залежить від демографії та соціального контексту. Таким чином, «Чи знижують статини рівень холестерину в сироватці крові?» зовсім інше питання, ніж «Якщо призначати статини людям з підвищеним рівнем холестерину, чи будуть вони жити довше?» оскільки останній вимагає поведінки як з боку клініциста (надання рецепта), так і з боку пацієнта (заповнення рецепта, а потім прийом ліків за призначенням).
Малюнок 6-1 ілюструє різницю між внутрішньою дійсністю та зовнішньою дійсністю. При цьому використовується когортна діаграма, але той же принцип застосовується до всіх досліджуваних конструкцій:

Ухил вибору
Упередження вибору може впливати як на внутрішню, так і на зовнішню обґрунтованість дослідження. Наведений вище приклад щодо фізичних вправ під час вагітності (де у мене була нерепрезентативна вибірка з популяції) - це вид упередженості відбору, що впливає на зовнішню валідність: мої результати узагальнюються лише для підмножини населення, з якої насправді була взята моя вибірка, а не для всього населення. Такий ухил вибору не є ідеальним, але можна легко відновитися, просто звузивши цільову групу, до якої будуть застосовуватися результати. Запитуючи «Кого отримали дослідники? Кого вони сумували?» допоможе в оцінці ступеня загального упередженості вибору.
В інших випадках упередження вибору може вплинути на внутрішню дійсність. Це набагато гірше, оскільки результати цього дослідження не можуть бути застосовані ні до кого, оскільки воно має фундаментальні недоліки. Ухил виділення, негативно впливає на внутрішню валідність, виникає, коли оголені та неекспоновані групи (для когортного дослідження) або хворі та нехворі групи (для дослідження з контролю випадків) не беруться з однієї і тієї ж популяції. Наприклад, при дослідженні фізичної активності матері та результатів праці vi «активна» група була набрана з пренатального класу вправ, але «сидяча» група була набрана з клінік пренатальної допомоги. У тій мірі, в якій люди, які добровільно вирішили оплатити та відвідувати заняття фізичними вправами спеціально для вагітних, відрізняються від загальної групи жінок, які отримують пренатальну допомогу, це дослідження має ухил вибору, що впливає на внутрішню валідність, оскільки відкриті та неекспоновані групи (зразки) походять від різних популяцій. Знову запитуючи: «Хто вони отримали? Кого вони сумували?» а також «Чи було це відрізнятися між двома групами?» допоможе тут.
Упередження вибору, що впливає на внутрішню валідність, може повзти іншими, менш очевидними способами, здебільшого пов'язаними з відсутніми даними. Чи відрізнявся рівень участі між двома групами? Чи було більше втрат для спостереження в одній групі порівняно з іншою? Будь-який з них може призвести до груп, які можуть не відображати ту саму основну популяцію, оскільки типи людей, які погоджуються брати участь у дослідженнях, відрізняються від тих, хто цього не робить, і типи людей, які випадають, відрізняються від тих, хто цього не робить. хворі пацієнти, як правило, кидають, тому що вони стають занадто хворими, щоб відвідувати відвідування клініки, пов'язаних з дослідженням. Якщо це відбувається більше в одній досліджуваній групі, ніж в іншій, це призводить до зміщення виділення.
Упередженість здорового працівника - це тип упередженості вибору, і це стосується того факту, що люди, які можуть працювати, як правило, здоровіші, ніж загальна чисельність населення, оскільки загальна чисельність населення включає людей, які занадто хворі для роботи. Таким чином, дослідження, які набирають із населення людей, які працюють, можуть не мати зовнішньої узагальненості - що добре, якщо хтось обережний при застосуванні результатів дослідження. Однак упередженість здорових працівників також може вплинути на внутрішню дійсність, якщо одна група набирається спеціально з населення робітників, а інша - від загального населення. Наприклад, якщо ми підозрюємо, що на заводі А є токсин навколишнього середовища (а група нашого когортного дослідження складається з працівників заводу А), то наша неекспонована група повинна бути працівниками десь ще - а не, скажімо, подружжя чи сусіди (які можуть працювати або не можуть працювати) викритих учасників.
Неправильний ухил класифікації
Неправильна класифікація стосується просто вимірювання речей неправильно, таким чином, що учасники дослідження потрапляють у неправильну коробку в таблиці 2 х 2: ми називаємо їх «хворими», коли насправді вони не є (або навпаки); ми називаємо їх «викритими», коли насправді вони не є (або навпаки).
Продовжуючи наш приклад фізичних вправ під час вагітності, скажімо, ми набираємо 1000 вагітних жінок та оцінюємо їх рівень фізичної активності. Ми вирішуємо, що кожен, хто відповідає рекомендаціям щодо фізичних навантажень під час вагітності (30 хвилин помірної активності, більшість днів тижня vii [2]) буде класифікований як «підданий», а кожен, хто повідомляє про меншу активність, буде «неекспонованим». Загалом, всі люди будуть надмірно повідомляти про свої рівні фізичної активності. ix (p46) Таким чином, у нашому дослідженні 1000 жінок ми очікували б певного рівня неправильної класифікації - якщо кожен трохи завищує свою кількість фізичної активності, то ті люди, які насправді отримали трохи менше рекомендованої суми, будуть неправильно класифіковані, оскільки їх надмірна звітність наштовхне їх у виставлену (відповідав вказівкам) групу.
Якщо саме так повинні виглядати дані (уявіть собі будь-яке захворювання, яке вам подобається тут):
Д+ | Д- | |
Е+ | 200 | 100 |
Е- | 300 | 400 |
Але замість цього, якщо ми неправильно класифікуємо деяких жінок як підданих через завищення звітності, таблиця може виглядати так:
Д+ | Д- | |
Е+ | 230 | 140 |
Е- | 270 | 360 |
Це називається недиференціальною неправильною класифікацією, оскільки вона відбувається з однаковою швидкістю (тут 10% неекспонованих були неправильно класифіковані як піддані) як у хворих, так і в нехворих групах. Недиференціальна неправильна класифікація не зовсім така ж, як випадкова помилка - у випадковій помилці ми можемо мати 10% неправильної класифікації, але вона буде йти в обох напрямках. Тут ми дійсно очікуємо лише завищення фізичної активності, тому це систематична помилка, або упередженість. Неправильна класифікація, як і всі інші форми упередженості, впливає на дослідження, даючи нам неправильну оцінку асоціації.
Приклад\(\PageIndex{1}\): Misclassification
Використовуючи першу таблицю 2 х 2 вище (тобто «правильні» дані - зверніть увагу, що це майже ніколи не спостерігається), коефіцієнт шансів (АБО) становить:
\[\mathrm{OR}=\frac{200 \times 400}{300 \times 100}=2.67\]
Тоді як коефіцієнт шансів на упереджені дані (ті, які ми фактично зібрали в нашому дослідженні):
\[\mathrm{OR}=\frac{230 \times 360}{140 \times 270}=2.19\]
Результат обчислення з даними, включаючи недиференціальну неправильну класифікацію, ближче до нульового, ніж правильний. У реальному житті ми ніколи не можемо спостерігати за «правильною» таблицею, і тому ми не можемо знати, наскільки або в якому напрямку наша оцінка упереджена - тільки що вона є.
Недиференціальна неправильна класифікація: зміщення до Null?
У прикладі вправ у вагітності оцінка АБО на основі упереджених даних була упереджена до нульового значення (тобто це ближче до 1.0, нульове значення для коефіцієнтів шансів), але це могло так само легко бути упередженим від нульового. Деякі старі підручники епідеміології скажуть, що недиференціальна неправильна класифікація завжди упереджується до нульового, але виявляється, що це неправда. 9p143 Найкраще припустити, що ви не знаєте, в який бік йде упередженість.
З плюсової сторони, навіть якщо дані неправильно класифіковані, якщо це недиференціальна неправильна класифікація, ми, ймовірно, все ще правильно класифікували людей. Якщо всі переоцінюють свою фізичну активність, ми все одно можемо сказати картоплю дивана від бігунів марафону. Таким чином, хоча оцінка асоціації, яку ми розрахували з нашими помилковими класифікованими даними (в яких кожен додав, скажімо, 30-60 хвилин до своїх щотижневих підсумків вправ) майже напевно не є «правильною», з недиференціальною неправильною класифікацією, ми часто можемо сказати щось про результати (можливо, що тим більше вправи один отримує, нижчий ризик серцевих захворювань?). Це твердження майже напевно залишиться вірним, навіть якщо ми змогли виправити завищену фізичну активність кожного і сформувати неупереджену оцінку асоціації.
Зворотна сторона - диференціальна неправильна класифікація. З диференційною неправильною класифікацією ми знову виявляємо, що деякі люди поміщені в неправильні поля в таблиці 2 × 2, але цього разу вона не однаково розподілена по всіх досліджуваних групах. Можливо, хворі люди неправильно повідомляють більше, ніж нехворі люди. Або, можливо, слідчі підсвідомо частіше класифікують когось як «хворого», якщо вони, як відомо, піддаються впливу. Диференціальна неправильна класифікація вважається смертельною загрозою для внутрішньої обґрунтованості дослідження. Автори дослідження, знаючи це, часто визнають помилки вимірювань у своєму дослідженні, але стверджують, що вони недиференціальні і тому по суті не мають значення. Коли ви зіткнетеся з подібними претензіями, продумайте це самі, і обов'язково погоджуєтеся з авторами, перш ніж цитувати їх роботи. Диференціальна неправильна класифікація зустрічається частіше, ніж багато хто з нас хотів би визнати.
Неправильна класифікація йде за численними іншими назвами, включаючи упередженість соціальної бажаності, упередженість інтерв'юера, упередженість клініциста, упередженість відкликання тощо. Незалежно від імені, однак, неправильна класифікація зводиться до того, що люди називаються підданими, коли вони не піддаються, не піддаються, коли вони є, не хворіють, коли насправді вони є, або хворіють, коли насправді вони не є. Розглядаючи дані, які повідомляються самостійно, як обговорювалося в попередньому розділі, ви повинні спочатку запитати себе: «Чи можуть люди сказати мені це?» Якщо ні, зупиніться. Але якщо так, то ви повинні подумати: «Чи скажуть мені це люди?» Якщо ні, то дані можуть мати ухил від неправильної класифікації.
Аналіз чутливості
Іноді називають аналізом упередженості, аналіз чутливості - це набір додаткових аналізів, проведених після того, як відомі основні результати дослідження, з метою кількісної оцінки того, скільки зміщення могло бути і в якому напрямку він змістив результати. Не всі дослідницькі питання та набори даних піддаються аналізу чутливості, але для тих, що є, це відмінний спосіб для авторів підвищити сприйняту достовірність своїх результатів. Не існує встановленого способу проведення аналізу чутливості; скоріше, один розглядає всі припущення, зроблені в рамках аналізу, і перевіряє, наскільки ці припущення, а не основна справжня асоціація, спричиняли результати.
Наприклад, якщо ми вивчали фізичну активність, і в нашому основному аналізі вирішили, що кожен, хто відповідає вказівкам, був «активним», а всі інші люди в дослідженні були «сидячими», то один аналіз чутливості може змінити цю точку відсікання (можливо, зараз ми заявляємо, що кожен накопичує 2 або більше годин на тиждень вправ є «активним», хоча це менше, ніж припускають вказівки) і подивіться, що таке нова оцінка асоціації. Якщо нова оцінка близька до початкової, то можна зробити висновок, що наш вибір точки зрізу (припущення, яке ми зробили під час аналізу) не вплинув на результати сильно. Це само по собі не виключає можливості того, що оригінальні результати є невірними, але це зменшує можливість того, що ми знайдемо зовсім іншу відповідь, якщо ми повторимо дослідження, використовуючи дещо інші методи.
Відсутність даних про окремі змінні також призводить до неправильної класифікації - наприклад, в США люди не люблять говорити про гроші, тому часто питання про доходи залишаються без відповіді. Якщо вид людини, який залишає питання про доходи порожнім, відрізняється від того, хто на нього відповідає, то дані не пропадають навмання. Якщо дані дійсно відсутні випадковим чином (що може статися, якщо, наприклад, деякі люди справді не бачать питання через примху в макеті сторінки), то результатом є трохи менший розмір вибірки (і відповідно менше потужності), але в іншому випадку це не має несприятливі наслідки. Однак в реальному житті дані майже ніколи не відсутні випадковим чином, а це означає, що вони відсутні за певною схемою і, таким чином, створюють упередження. Якщо автори дослідження стверджують, що у них випадково відсутні дані, ретельно подумайте про сценарій і переконайтеся, що ви згодні. Найчастіше автори дослідження просто взагалі не згадують відсутні дані. [3] Якщо важлива змінна в аналізі відсутня для більш ніж 5% вибірки, але це не обговорюється авторами, то будьте обережні до результатів. Вони, ймовірно, упереджені.
Публікація Упередженість
Упередженість публікацій виникає через те, що статті з більш захоплюючими результатами частіше публікуються. Стаття, основним висновком якої є «немає зв'язку між x і y», важко опублікувати - настільки, що існує цілий, законний рецензований журнал, присвячений виключно публікації цих так званих негативних результатів.
Цей вид упередженості стосується не окремих досліджень, а скоріше до областей літератури в цілому. Якщо статті з більшими оцінками асоціації та/або меншими p -значеннями частіше публікуються, то при спробі переглянути весь текст літератури на задану тему (наприклад, чи повинні люди похилого віку приймати профілактичний аспірин для запобігання інфарктів?) , картина, яку ви отримуєте, є упередженою, тому що були опубліковані лише захоплюючі статті. Всі папери, які не показали впливу аспірину на інфаркт, не були опубліковані. Це варто мати на увазі, коли ви робите пошуки літератури і обговорюється далі в розділі 9.
Висновок
Всі епідеміологічні дослідження включають упередженість. Слідчі можуть мінімізувати упередження, які присутні за допомогою хороших методів проектування та вимірювання, але деякі завжди залишаться. Ці упередження, що впливають на внутрішню валідність дослідження (упередження вибору, яке стосується більше однієї групи, ніж іншої, або диференціальна неправильна класифікація) роблять це дослідження або зовсім марним, або корисним лише з особливою обережністю. Зміщення вибору, що впливає лише на зовнішню валідність - наявність недиференціальної неправильної класифікації або зміщення вибору, що діє на всій вибірці, - керований, доки хтось розуміє пов'язані з цим обмеження. Відсутні дані та ступінь, в якій неучасть або невідповідність могли вплинути на результати, завжди слід уважно розглядати.
Посилання
я Джонсон CY. Усі упереджені: робота професора Гарварду показує, що ми ледве знаємо власний розум. Бостонський глобус. 2013 рік. https://www.boston.com/news/science/... -наші власні уми. Доступ до 27 листопада 2018 р. (Повернення)
II. Bovbjerg M, Siega-Riz A, Evenson K, Goodnight W. Методи оцінки впливу впливають на асоціації між фізичною активністю матері та кесаревим розтином. J Phys Закон Здоров'я. 2015; 12 (1) :37-47. (Повернення 1) (Повернення 2)
III. Вагітність, інфекція та харчування (PIN). UNC Вбивства школи глобального громадського здоров'я. https://sph.unc.edu/epid/pregnancy-i...nutrition-pin/. Доступ до 18 жовтня 2018 року.
IV. Евенсон КР, Савіц DA, Хьюстон С.Л. Фізичні навантаження на дозвілля серед вагітних жінок в США. Дитяча перинатна епідеміологія. 2004; 18 (6) :400-407. дої:10.1111/j.1365-3016.2004.00595.x (Повернення)
v. Ротман КДж., Галлахер JEJ, Хетч Е. Чому слід уникати репрезентативності. Інт J Епідеміол. 2013; 42 (4) :1012-1014. дої:10.1093/і/дис223
vi. Бекманн CR, Бекманн Каліфорнія. Вплив структурованої програми передпологових вправ на вагітність та результат пологів у первісток. J Рекорд Мед. 1990; 35 (7) :704-709. (Повернення)
vii. Висновок комітету ACOG. Вправи під час вагітності та післяпологового періоду. 2002 рік. Американський коледж акушерів і гінекологів. Int J Гінеколь акушерський Off Organ Int Fed Гінеколь Акушер. 2002; 77 (1) :79-81. (✅ Повернення)
VIII. Фізична активність для всіх: рекомендації. Центри контролю та профілактики захворювань (CDC). http://www.cdc.gov/physicalactivity/...es/adults.html. Доступ до 10 лютого 2014 р. (← Повернення)
мікс. Дішман РК, Хіт ГВ, Лі І-М. Епідеміологія фізичної активності. 2-е изд. Шампейн, Іллінойс: Кінетика людини; 2013. (← Повернення)
- Усі дослідження з учасниками людини повинні бути схвалені комісією з питань етики, яку зазвичай називають інституційною оглядовою радою (IRB) у США. IRB повинен затвердити всі навчальні матеріали, включаючи рекламні оголошення, і всі такі рекламні оголошення повинні чітко викладати дослідницьке питання. ←
- Проникливі серед вас помітять, що ці рекомендації чудово виглядають як рекомендації viii для невагітних осіб. Дійсно, не допускаючи певних чітко визначених і відносно рідкісних ускладнень, вагітні жінки повинні бути такими ж активними, як і невагітні люди. ←
- Дивно, але правда! ←