1.11: Скринінг та діагностичне тестування
- Page ID
- 105369
Цілі навчання
Прочитавши цю главу, ви зможете зробити наступне:
- Диференціювати скринінгове та діагностичне тестування
- Розрахуйте та інтерпретуйте загальні характеристики тесту
- Обговорити роль громадського здоров'я в скринінгових програмах
Dx = хвороба
Sx = симптоми
Hx = історія
Tx = лікування
Sn = чутливість
Sp = специфічність
PPV = позитивне прогностичне значення
NPV = негативне прогностичне значення
Pt = пацієнт.
Вступ
У цьому розділі ми розглянемо як скринінгове, так і діагностичне тестування. Хоча працівники охорони здоров'я зазвичай не беруть безпосередньої участі у діагностиці пацієнтів, тести, що використовуються для скринінгу та діагностичного тестування, часто однакові (різниця в контексті), і для оцінки точності цих тестів використовуються ті самі математичні інструменти. Крім того, працівникам охорони здоров'я, які беруть участь у спостереженні за захворюваннями, може знадобитися знати, як інтерпретувати ці результати під час оцінки визначень випадків спостереження.
Скринінг проти діагностичного тестування
Слово скринінг відноситься до тестування безсимптомної популяції для певного стану з метою виявлення тих, хто має стан, щоб їх можна було лікувати рано. Загальні скринінгові тести, які в даний час використовуються в США, включають різні скринінги на рак (мамограми, мазки папа, шкірні перевірки для тих, хто має високий ризик розвитку меланоми); звичайний скринінг гіпертонії в кабінетах лікарів (саме тому вони приймають артеріальний тиск кожного разу, коли ви йдете); слух, зір, та стоматологічний скринінг у початкових школах; щорічний скринінг на туберкульоз та ВІЛ серед медичних працівників тощо. Чиновники охорони здоров'я часто беруть участь у програмах скринінгу або безпосередньо (надання персоналу для відвідування початкової школи для проведення скринінгів слуху) або опосередковано (кампанії з охорони здоров'я для збільшення використання мазків пап).
Діагностичне тестування, з іншого боку, проводиться пацієнту, який має симптоматику, щоб визначити, який стан у них є. Клініцисти виконують те, що називається диференціальною діагностикою, коли стикаються з пацієнтом з новими скаргами. У двох словах, лікар, медсестра або інший постачальник медичних послуг бере всю відому інформацію з історії пацієнта та фізичного обстеження і вирішує, що може бути не так. Наприклад, якщо 24-річна жінка звертається до клініки зі скаргами на порушення зору, а потім сильний головний біль, це може бути будь-яка кількість речей: струс мозку, мігрень з аурою, геморагічний інсульт [1], менінгіт тощо. Завдання клініциста - визначити, який саме, щоб пацієнт міг лікуватися правильно. Процес диференціальної діагностики включає введення діагностичних тестів, які призначені для того, щоб або виключити умови в списку диференціального діагнозу.
Повертаючись до нашого прикладу, ймовірність струсу мозку можна оцінити, опитувавши пацієнта про будь-яку недавню травму голови або шиї (питання можуть бути діагностичними тестами!). Якщо пацієнтка заперечує таку травму (наприклад, вона не займалася контактним видом спорту, впала, була в автомобільній аварії тощо протягом останніх 24 годин), то ми, ймовірно, виключили струс мозку. Наступним завданням буде виключити геморагічний інсульт — інсульти у молодих людей дуже рідкісні, але не нечувані, і чим швидше вони лікуються, тим кращий прогноз. Ми могли б виключити геморагічний інсульт, шукаючи кров у спинномозковій рідині пацієнта (діагностичним тестом у цьому випадку є спинний кран). Припускаючи, що спинномозкова рідина пацієнта дійсно очищена від крові, ми проводимо тест, щоб виключити менінгіт. Якщо цей тест також зрозумілий, то ми можемо сміливо припустити, що у неї мігрень, і запропонувати відповідне лікування.
Порядок, в якому один правила в або виключає умови переліку диференціальної діагностики, залежить від їх відносної тяжкості, витрат, пов'язаних з різними тестами, і поширеності умов, про які йде мова. У цьому сценарії було дуже важливо швидко виключити інсульт, тому що якби це був інсульт, лікування потрібно було б розпочати якомога швидше, тоді як мігрень може чекати годину, не завдаючи додаткової шкоди. Це не подобається людині з мігренню, але це не вб'є їх або не призведе до тривалої інвалідності. Пухлина мозку також входить до списку диференціального діагнозу; однак цей стан дуже рідкісний у пацієнтів у 20 років, і затримка лікування пухлини мозку на 24 години не має значення (на відміну від інсульту, який також рідкісний, але для якого не можна відкладати лікування). Таким чином, виключивши струс мозку, менінгіт та інсульт, ми лікували пацієнта від мігрені. Якби їй не стало краще через 24—48 годин, ми б повернулися до списку диференціальних діагнозів і, можливо, тесту на нейробластому або інші види раку мозку.
Як згадувалося вище, часто одні й ті ж тести використовуються як для скринінгу, так і для діагностичного тестування; відмінність залежить від контексту. Якщо у мене немає жодних симптомів раку молочної залози і я маю мамографію, то це скринінговий тест (скринінг робиться в безсимптомних популяціях). Якщо, з іншого боку, я знайду шишку в грудях, зверніться до лікаря, і вона відправляє мене на мамографію, це зараз діагностичний тест, тому що я симптоматичний.
Критичні точки захворювання та інші речі, які слід розуміти про скринінг
Цифри в цьому розділі та ідея критичних точок адаптовані з лекцій доктора Девіда Слаусона в Медичній системі Університету Вірджинії, факультет сімейної медицини, в 2004-2005 роках.
Природний перебіг медичного стану виглядає наступним чином:

Перший крок - біологічне початок захворювання. Це може бути перша мутація, яка перетворює клітину в ракову клітину. Це може бути вірус, що потрапляє через чиїсь слизові оболонки і починає розмножуватися. Важливо, що біологічний початок не спостерігається.
Зрештою, у людини із захворюванням симптоми будуть досить важкими, що вони звертаються за лікуванням: вони звертаються до клініки, ходять до відділення невідкладної допомоги, ходять до аптеки і купують протинабряковий засіб; врешті-решт вони будуть шукати якесь лікування. Точні терміни будуть варіюватися від людини до людини і від хвороби до хвороби.
Завершальним етапом нашої природної історії хвороби є результат. Або їм стає краще, або вони ні.
То що ж таке скринінг? Це ідея скринінгу:

Пам'ятайте, що програма скринінгу починається з безсимптомних людей - нормальних, повсякденних людей - і перевіряє їх, чи є у них захворювання.
Ідея полягає в тому, щоб знайти хворобу рано. Скринінг не є первинною профілактикою. [2] Скринінг виявляє раннє захворювання; це не запобігає виникненню захворювання. Скринінг цілком може запобігти поганим результатам захворювання (вторинна профілактика), але це не запобігає самому захворюванню.
Таким чином, першим критерієм успішної програми скринінгу є те, що існує тест, який може виявити раннє, передсимптоматичне захворювання. Це не завжди так - наприклад, ми не проводимо скринінг на рак яєчників частково тому, що в даний час такого тесту не існує. Другим критерієм успішної програми скринінгу є те, що стан є досить поширеним і/або витрати на його не лікування досить високі, щоб зробити його варто скринінгу на рівні населення. Ще одна причина, по якій ми не перевіряємо рак яєчників, полягає в тому, що поширеність дуже низька, і, таким чином, програма скринінгу, можливо, не варта ресурсів.
Наступна важлива ідея полягає в тому, що кожна хвороба має критичну точку. Якщо лікувати захворювання до того, як воно дійде до критичної точки, можна змінити результат: хворий вилікується, проживе довше, або буде жити краще. Однак, якщо ви лікуєте хворобу після критичної точки, лікування не матиме ніякого ефекту (саме тому у нас є хоспіс - після певного моменту подальші агресивні методи лікування не корисні і потенційно навіть шкідливі).
Замислюючись про реалізацію програми скринінгу на дане захворювання, потрібно враховувати терміни критичних точок. Наприклад, що робити, якщо критична точка (представлена червоною лінією) для даного захворювання виникає тут:

У наведеному вище сценарії (рис. 11-3) не було б рентабельним екранувати цю умову, оскільки виявлення його рано не допомагає. На той час, коли люди звертаються за допомогою до своїх симптомів, залишається ще достатньо часу для їх лікування. Скринінг за цим сценарієм не завдасть фізичної чи емоційної шкоди як такої, але витрачає ресурси. Ми дізнаємося, що і рак передміхурової залози, і рак молочної залози, ймовірно, потрапляють в цю категорію. За винятком певних груп дуже високого ризику, більшість чоловіків більше не регулярно перевіряються на рак передміхурової залози, і з'являється все більше доказів того, що мамографії можуть бути справді корисними лише для жінок високого ризику. ii
Що робити, якщо натомість критична точка тут:

У цьому випадку (рис. 11-4), ми також, ймовірно, не буде екранувати цю умову, тому що на той час, коли ми екрануємо, вже занадто пізно. Скринінг у цьому сценарії спричинить емоційну шкоду, оскільки люди знатимуть, що вони мають невиліковне захворювання протягом більш тривалого періоду часу. Однак для дуже заразного стану ми можемо перевіряти людей у цьому сценарії - не для того, щоб ми могли їх лікувати, але щоб вони могли вживати запобіжних заходів та не поширювати їх на інших. Наприклад, до прийому антиретровірусних препаратів ми проводили обстеження груп високого ризику на ВІЛ.
Отже, скринінг є найбільш корисним у такому сценарії:

У цьому випадку раннє виявлення дійсно має значення. На той час, коли у деяких пацієнтів з'являються симптоми, лікувати їх вже пізно, але якщо ми зможемо виявити хворобу раніше, є ще час, щоб допомогти їм. Ми все ще можемо не реалізувати загальнопопуляційну програму скринінгу, якщо захворювання зустрічається рідко, а вартість скринінгового тесту досить висока, наприклад. Але тільки в цьому сценарії, де критична точка лежить між виявленням скринінгу та пошуком лікування, ми повинні навіть розглянути можливість скринінгу.
Точність скринінгових та діагностичних тестів
Існує 4 тестові характеристики, які ми використовуємо для кількісної оцінки того, наскільки точним є конкретний тест: чутливість, специфічність, позитивне прогнозне значення (PPV) та негативне прогнозне значення (НПВ). Перші 2 відомі як «фіксовані характеристики тесту», оскільки вони не змінюються, незалежно від поширеності захворювання. Однак PPV та NPV змінюються, коли поширеність захворювань у основній популяції змінюється.
Розрахунок цих 4 тестових характеристик вимагає, щоб ми розташували наші дані в таблиці 2 × 2. Цього разу, однак, замість експозиції зліва, у нас є результат тесту:
Д+ | Д- | Всього | |
Т+ | ТП | ФП | ТП+ФП |
Т- | FN | TN | ФН+ТН |
Всього | ТП+ФН | ФП+ТН | ТП+ФП+ТН+ФН |
Дивлячись на скринінг 2 × 2 таблиці, ви помітите, що клітинки більше не позначені ABCD. Вони все ще можуть бути - і справді, у багатьох підручниках вони є. Однак я віддаю перевагу цьому позначенню, оскільки воно нагадує вам, що кожна клітинка в цьому сценарії. Зокрема, верхня ліва клітина містить «справжні позитиви» - ці люди мають захворювання (відповідно до золотого стандартного методу діагностики - див. Нижче) і тест позитивний результат за допомогою скринінгового або діагностичного тесту. З іншого боку, у верхній правій клітині містяться «помилкові спрацьовування» - люди, які дали позитивний результат за допомогою скринінгового або діагностичного тесту, але насправді не мають захворювання. Нижня ліва клітина містить «помилкові негативи» - ці люди мають захворювання, але чомусь тест негативний. Нарешті, нижня права клітина складається з «справжніх негативів», які не мають захворювання і тест негативний.
Один отримує дані для скринінгу 2 × 2 таблиці шляхом введення як тест, який ми оцінюємо, так і золотий стандартний метод діагностики для великої групи людей. Наприклад, золотим стандартом діагностики хвороби Альцгеймера є наявність певного виду мозкового нальоту, що спостерігається при розтині. Оскільки це неможливо зробити для живих літніх пацієнтів, які підозрювали деменцію, дослідники розробили тест Mini Mental State (MMS). iii Щоб створити вищевказану таблицю 2 × 2, то слід ввести MMS групі людей похилого віку та класифікувати їх результати як позитивні (T+) або тестування негативні (T -). Тоді можна збирати дані про розтин, коли вони вмирають, і класифікувати тих самих осіб, як або мали хворобу Альцгеймера (D+), або ні (D -).
В інших сценаріях обидва можна зробити одночасно (а не чекати смерті) - наприклад, використовуючи Інвентар депресії Бека (BDI) як тест на депресію та порівнюючи результати з серією відвідувань з фахівцем з психічного здоров'я, кваліфікованим для остаточної діагностики депресії. Причиною проведення тесту в останньому випадку є те, що БДІ набагато швидше і дешевше, ніж відправляти всіх на офіційну психіатричну оцінку; БДІ - це також опитувальник для самостійного введення, який може бути використаний у великих когортних дослідженнях (тоді як діагноз, опосередкований клініцистом, є неспроможним для великих і/або географічно розрізнених досліджуваних популяцій).
Зверніть увагу, що розрахувати поширеність захворювання у вибірці можна за допомогою скринінгової таблиці 2×2: кожен з хворобою (TP+FN) над усіма у вибірці.
Чутливість і специфічність
Чутливість (Sn) - це ймовірність того, що пацієнт позитивний тест, враховуючи, що у них є захворювання. У вірогідному позначенні це пишеться наступним чином:

Специфічність (Sp) - це ймовірність того, що пацієнт тести негативні, враховуючи, що у них немає захворювання:

Обидва ці значення є пропорціями і зазвичай виражаються у відсотках.
Нагадаємо, що чутливість і специфічність є фіксованими тестовими характеристиками — вони не змінюються, якщо змінюється переважання стану у вибірці. Значення чутливості та специфічності публікуються, коли нові тести стають доступними, і використовуються клініцистами, щоб вирішити, які тести замовити.
Для діагностичного тестування нагадаємо, що ми намагаємося іноді виправитися, а в інший час виключити. Два поширених мнемонічних пристрої - Spin і SnOut: тест з високою специфічністю, коли позитивний, правила IN, і тест з високою чутливістю, коли негативна, виключає OUT. Щоб зрозуміти чому, озирніться назад на формули. Знаменником специфічності є FP+TN (всі особини без хвороби), а чисельник - якраз TN. Якщо специфічність висока (близька до 100%), то ФП повинен бути дуже низьким. Таким чином, пацієнт з позитивним результатом на високо специфічному тесті, ймовірно, є справжнім позитивом. Цю ж логіку можна використовувати для розуміння SnOut: знаменник чутливості - TP+FN (всі особини з хворобою), а чисельник - якраз TP. Якщо чутливість близько 100%, то за визначенням помилкових негативів мало. Негативний результат на високочутливому тесті, таким чином, майже напевно є справжнім негативом. Таким чином, клініцисти виберуть тест з високою чутливістю, коли вони хочуть виключити (як при струсі мозку або інсульті, у нашому прикладі вище), і тест з високою специфічністю, коли вони хочуть правити.
Для скринінгу ми тестуємо безсимптомну популяцію - таким чином ми хочемо мінімізувати помилкові негативи. Це тому, що ми не хотіли б говорити комусь, що вони не хворіють, якщо вони насправді не є. Тому програми скринінгу використовують тести з високою чутливістю.
Позитивні та негативні прогнозні значення
Позитивним прогнозним значенням є ймовірність того, що у вас насправді є захворювання, враховуючи, що ви тестували позитивно (уважно дивіться і переконайтеся, що ви розумієте, чим це відрізняється від чутливості):

Негативним прогнозним значенням є ймовірність того, що у вас немає захворювання, враховуючи, що ви тестували негативно:

Знову ж таки, ці величини є пропорціями і зазвичай виражаються у відсотках.
PPV та NPV використовуються для інтерпретації результатів тестування після того, як ці результати відомі. Однак, на відміну від чутливості та специфічності, PPV та NPV змінюються, оскільки поширеність захворювання у вибірці змінюється - тому важливо знати щось про поширеність захворювання в цільовій групі, до якої належить людина, перш ніж ви зможете інтерпретувати результати їх тестів. Наприклад, якщо пацієнт позитивний тест на туберкульоз (туберкульоз), і ви знаєте, що поширеність туберкульозу в популяції, з якої пацієнт походить, становить 10%, а ППВ з 10% поширеністю становить 52,6%, то інтерпретація цього результату тесту така: існує 52,6% ймовірність того, що цей пацієнт має туберкульоз (є, таким чином, шанс 47,4%, що у них немає туберкульозу і результат був хибнопозитивним).
Загалом, PPV зменшиться, а NPV збільшуватиметься у міру зменшення поширеності. Це має інтуїтивний сенс: як стан стає більш рідкісним, то здогадування про те, що у пацієнта немає захворювання, стає все більш імовірно правильним. Надзвичайно низький PPV, вторинний до низької поширеності, був обґрунтуванням рекомендації 2009 року Цільової групи з профілактичних служб США (USPSTF) про те, що жінки у віці 40 років перестають обстежуватися на рак молочної залози, якщо вони не є надзвичайно високим ризиком. iv Поширеність захворювання серед жінок у віці 40 років дуже низька (0,98%) v, а PPV у цій популяції, таким чином, значно менше 1% - це означає, що більше 99% жінок, які відправляються на подальше тестування (біопсія молочної залози, як правило), є помилковими спрацьовуваннями і, таким чином, проходять цей дорогий, інвазивне спостереження (з відповідним йому емоційним напруженням) без необхідності. Для жінок з сильним сімейним анамнезом та/або які, як відомо, є носіями BRCA-1 або BRCA-2, мамографія для 40-річних дітей все ще є виправданою, оскільки ці жінки походять з основної популяції, в якій поширеність (і, отже, PPV) набагато вища.
Приклад
Скажімо, розроблений новий тест на анемію, який не вимагає палички пальця для отримання крові (ніхто не любить голки!) - можливо, за допомогою сканера, який може виявити рівень гемоглобіну через тонку шкіру на нижній стороні зап'ястя. Опублікована наступна таблиця 2 × 2:
Д+ | Д- | Всього | |
Т+ | 101 | 15 | 116 |
Т- | 18 | 866 | 884 |
Всього | 119 | 881 | 1000 |
У цьому випадку результати тесту (або Т+ або Т-) надходять від сканера зап'ястя, а результати захворювання (D+ або D-) будуть надходити від звичайного методу діагностики анемії, який вимагає взяття крові.
Зразок розрахунків
Використовуючи дані з наведеної вище таблиці, ми можемо обчислити чотири тестових характеристики.
Чутливість = 84,9%
Специфічність = 98,3%
Позитивне прогнозне значення = = 87.0%
Від'ємне прогнозне значення = = 98.0%
Ми також можемо обчислити поширеність анемії в цій вибірці.
Поширеність = = 11,9%
Давайте тепер скажемо, що є пацієнт, який здав новий тест і дав позитивний результат. Однак ми знаємо, що пацієнт з населення з меншою поширеністю анемії, ніж 11,9% - чоловіки-підлітки, наприклад, серед яких поширеність становить близько 1%. vi У цьому випадку вищевказане ППВ більше не застосовується. Однак, оскільки ми знаємо чутливість та специфічність, ми можемо створити нову таблицю 2 × 2, з якої ми можемо обчислити новий PPV для меншої популяції поширеності. Почнемо з того, що вирішимо (довільно), що у нас знову буде 1000 чоловік в таблиці:
Д+ | Д- | всього | |
Т+ | |||
Т- | |||
всього | 1000 |
Якщо поширеність становить 1%, то очікується, що захворювання мають 10 осіб:
Д+ | Д- | всього | |
Т+ | |||
Т- | |||
всього | 10 | 990 | 1000 |
Оскільки чутливість становить 84,9%, а чутливість є фіксованою тестовою характеристикою, ми можемо вирішити для справжніх позитивів наступним чином:
Сн =
0,849 = ТП/10
ТП = 8,49
Потім ми віднімаємо, щоб отримати помилкові негативи:
Д+ | Д- | Всього | |
Т+ | 8.49 | ||
Т- | 1.51 | ||
Всього | 10 | 990 | 1 000 |
Аналогічний розрахунок ми можемо зробити з відомою специфічністю 98,3%:
Потім ми можемо заповнити нехворий стовпець:
Д+ | Д- | Всього | |
Т+ | 8.49 | 16.83 | 25.32 |
Т- | 1.51 | 973.17 | 974,68 |
Всього | 10 | 990 | 1 000 |
Тепер ми можемо обчислити наш новий PPV:
Таким чином, існує лише 33,5% шансів, що наш чоловічий підліток насправді має анемію на основі позитивного тесту на сканування шкіри. (Ми будемо стежити за взяттям крові, щоб підтвердити - якби він випробував негативний результат, новий NPV був би 99,9% - не потрібно брати кров!)
Резюме
Скринінг та діагностичне тестування є подібними процедурами; різниця залежить від контексту (чи є у досліджуваної особи симптоматика чи ні). Точність таких тестів кількісно визначається чутливістю і специфічністю (використовується завчасно для підбору правильного тесту), а також позитивними і негативними прогнозними значеннями (використовуються після того, як результати тесту відомі, для їх інтерпретації). Необхідно знати поширеність захворювання в цільовій групі населення, щоб використовувати ППВ і НПВ.
Посилання
i. кільце КЛ, Модесітт СК. Спадкові види раку в гінекології: що лікарі повинні знати про генетичне тестування, скринінг та зниження ризику. Акушер-гінеколог Клін-Північ Ам. 2018; 45 (1) :155-173. дої:10.1016/j.ogc.2017.10.011 (Повернення)
II. Велч Г., Пророк ПК, Крамер БС. Розмір пухлини раку молочної залози та ефективність скринінгу. N Енгл Дж Мед. 2017; 376 (1) :94-95 дої:10.1056/NEJMC1614282 (Повернення)
III. Ровнер BW, Фольштейн М.Ф. Міні-психічний державний іспит в клінічній практиці. Хосп Практ Вид. 1987; 22 (1А): 99, 103, 106, 110. (0 Повернення)
IV. Підсумкове оновлення резюме: рак молочної залози, скринінг. США превентивні служби Цільова група. https://www.uspreventiveservicestaskforce.org/Page/Document/UpdateSummaryFinal/breast-cancer-screening. Доступ до 27 листопада 2018 р. (Повернення)
v. Візуалізація даних USCS. CDC. https://www.cdc.gov/cancer/dcpc/data/. Доступ до 27 листопада 2018 р. (Повернення)
vi. Looker AC, Далман PR, Керролл MD, Гюнтер EW, Джонсон CL. Поширеність дефіциту заліза в США. СІЧЕНЬ 1997; 277 (12) :973-976. (Повернення)
- Розрізняють два види інсультів: ішемічний і геморагічний. Ішемічні інсульти викликаються згустками крові в головному мозку, а геморагічні інсульти викликані кровотечею в головному мозку. Останні набагато частіше зустрічаються у молодих людей (ішемічні інсульти були б майже нечуваними у інакше здорової 24-річної жінки), хоча ішемічні інсульти більш поширені в цілому. Це дійсно два різних захворювання, але вони викликають дуже схожий набір симптомів, тому до нашого розуміння процесів хвороби, що стоять за ними, всі такі симптоми були класифіковані як «інсульт». » 17
- Ця помилка регулярно з'являється в літературі! Див., наприклад, Ring et al. i