1.5: Змішані змінні
Цілі навчання
- Змішана змінна - це змінна, яка може впливати на залежну змінну. Це може привести до помилкових висновків про взаємозв'язок між незалежними і залежними змінними. Ви маєте справу з заплутаними змінними, керуючи ними; шляхом зіставлення; шляхом рандомізації; або статистичного контролю.
Завдяки різноманітності генетичних факторів, факторів розвитку та навколишнього середовища немає двох організмів, жодних двох зразків тканин, жодних двох клітин не є абсолютно однаковими. Це означає, що коли ви розробляєте експеримент із зразками, які відрізняються незалежною змінноюX, ваші зразки також будуть відрізнятися в інших змінних, про які ви можете або не знаєте. Якщо ці змішані змінні впливають на залежну змінну,Y яка вас цікавить, вони можуть обдурити вас, думаючи, що є зв'язок міжX іY коли насправді немає. Або змішані змінні можуть спричинити стільки змін у томуY, що важко виявити реальні відносини міжX іY коли вони є.

Як приклад змішаних змінних, уявіть, що ви хочете знати, чи генетичні відмінності між американськими в'язами (які сприйнятливі до хвороби голландських в'язів) та Прінстонськими в'язами (штам американських в'язів, стійкий до хвороби голландських в'язів) спричиняють різницю в кількості пошкоджень комахами їх листя. Ви озираєтеся навколо своєї місцевості, знаходите20 американських20 в'язів і Прінстонських в'язів, збираєте50 листя з кожного і вимірюєте площу кожного листа, який з'їли комахи. Уявіть, що ви виявите значно більше пошкоджень комахами на Прінстонських в'язах, ніж на американських в'язах (я поняття не маю, чи це правда).
Можливо, генетична різниця між типами в'яза безпосередньо спричиняє різницю в кількості пошкоджень комахами, що саме те, що ви шукали. Однак, ймовірно, будуть деякі важливі змішані змінні. Наприклад, багатьом американським в'язам багато десятиліть, тоді як Прінстонський штам в'язів був зроблений комерційно доступним лише недавно, і тому будь-які в'язи Прінстона, які ви знайдете, ймовірно, лише кілька років. Американські в'язи часто обробляють фунгіцидом, щоб запобігти хворобі голландських в'язів, тоді як це не було б необхідним для в'язів Прінстона. Американські в'язи в деяких умовах (парки, узбіччя вулиць, нечисленні, що залишилися в лісах) можуть отримувати відносно невеликий догляд, тоді як в'язи Прінстона коштують дорого і, ймовірно, посаджені фанатиками в'яза, які добре доглядають за ними (підживлення, полив, обрізка тощо). Легко уявити, що будь-яка різниця в пошкодженні комах між американськими та Прінстонськими в'язами може бути викликана не генетичними відмінностями між штамами, а заплутаною змінною: віком, обробкою фунгіцидами, добривами, водою, обрізкою чи чимось іншим. Якщо ви дійдете висновку, що Прінстонські в'язи мають більше шкоди комахами через генетичну різницю між штамами, коли насправді це тому, що в'язи Прінстона у вашому зразку були молодшими, ви будете виглядати як ідіот для всіх своїх колег вчених в'язів, як тільки вони з'ясують вашу помилку.
З іншого боку, скажімо, ви не так багато ідіот, і ви переконаєтеся, що ваш зразок Прінстонських в'язів має такий же середній вік, як і ваш зразок американських в'язів. Існує ще багато варіацій у віці між окремими деревами у кожному зразку, і якщо це впливає на пошкодження комахами, між окремими деревами буде багато різниць у кількості пошкоджень комахами. Це ускладнить пошук статистично значущої різниці в пошкодженні комах між двома штамами в'язів, і ви можете пропустити виявлення невеликої, але захоплюючої різниці в пошкодженні комах між штамами.
Управління змішаними змінними
Проектування експерименту для усунення відмінностей через змішані змінні є критично важливим. Один із способів полягає в тому, щоб контролювати можливу змішувальну змінну, тобто ви зберігаєте її однаковою для всіх людей. Наприклад, ви можете посадити купу американських в'язів і купу в'язів Прінстона одночасно, щоб вони були одного віку. Можна було посадити їх в одному полі, і дати їм все однакову кількість води і добрив.
Легко контролювати багато з можливих заплутаних змінних в лабораторних експериментах на модельних організмах. Всі ваші миші, або щури, або дрозофіли будуть одного віку, однієї статі і того ж інбредного генетичного штаму. Вони будуть рости в однакових ємностях, харчуючись однією і тією ж їжею і п'ючи ту ж воду. Але завжди є деякі можливі змішані змінні, які ви не можете контролювати. Ваші організми можуть бути з одного генетичного штаму, але нові мутації означатимуть, що між ними все ще існують деякі генетичні відмінності. Ви можете давати їм однакову їжу та воду, але деякі можуть їсти або пити трохи більше, ніж інші. Після контролю всіх змінних, які ви можете, важливо мати справу з будь-якими іншими змішаними змінними шляхом рандомізації, узгодження або статистичного контролю.
Контролювати змішані змінні важче з організмами, які живуть поза лабораторією. Ті в'язи, які ви посадили в одному полі? Різні частини поля можуть мати різні типи ґрунту, різну швидкість просочування води, різну близькість до доріг, будинків та інших лісів, а також різні вітрові моделі. І якщо ваші експериментальні організми - це люди, є багато заплутаних змінних, які неможливо контролювати.
Рандомізація
Після того, як ви розробили свій експеримент, щоб контролювати якомога більше змішаних змінних, вам потрібно рандомізувати ваші зразки, щоб переконатися, що вони не відрізняються між змішаними змінними, які ви не можете контролювати. Наприклад, припустимо, ви збираєтеся змусити20 мишей носити сонцезахисні окуляри і залишати20 мишей без окулярів, щоб побачити, чи допомагають сонцезахисні окуляри запобігти катаракті. Ви не повинні тягнутися до відра40 мишей, захопити першого20 ви зловили і надягати на них сонцезахисні окуляри. Перших20 мишей, яких ви ловите, може бути легше зловити, оскільки вони найповільніші, найповільніші або ті, що мають найдовші хвости; або ви можете підсвідомо вибрати найжирніших мишей або найсимпатичніших мишей. Я не знаю, чи ваші миші, що носять сонцезахисні окуляри, бути повільнішими, приборканими, з довшими хвостами, товстішими або симпатичнішими, зробить їх більш-менш сприйнятливими до катаракти, але ви також не знаєте. Ви не хочете знайти різницю в катаракті між сонцезахисними окулярами і мишами, що не носять сонцезахисні окуляри, тоді доведеться турбуватися, що, можливо, це зайвий жир або довші хвости, а не сонцезахисні окуляри, що викликало різницю. Таким чином, ви повинні випадковим чином призначити мишей до різних груп лікування. Ви можете дати кожній миші ідентифікаційний номер і мати комп'ютер випадковим чином призначити їх двом групам, або ви можете просто перевернути монету кожного разу, коли ви витягуєте мишу з відра мишей.
У прикладі миші ви використовували всіх40 своїх мишей для експерименту. Часто ви виберете невелику кількість спостережень з набагато більшої популяції, і важливо, щоб це була випадкова вибірка. У випадковій вибірці кожна людина має однакову ймовірність вибірки. Щоб отримати випадковий зразок50 в'язів з лісу з700700 в'язами, ви могли б з'ясувати, де знаходиться кожне з700 в'язів, дати кожному з них ідентифікаційний номер, написати цифри на папірці, покласти папірці в капелюх і випадковим чином витягнути50 (або мати комп'ютер випадково вибирайте50, якщо вам лінь заповнювати700 папірці або не володієте капелюхом).
Ви повинні бути обережними, щоб переконатися, що ваш зразок дійсно випадковий. Я почав писати: «Або простішим способом випадкового зразка дерев50 в'яза було б випадковим чином вибирати50 місця в лісі, маючи комп'ютер випадковим чином вибрати координати GPS, а потім вибірка дерева в'яза найближче до кожного випадкового місця». Однак це було б помилкою; в'яз, яке було далеко від інших в'язів, майже напевно буде найближчим до одного з ваших випадкових місць, але ви навряд чи будете зразки в'яза посеред щільної купи в'язів. Досить легко уявити, що близькість до інших дерев в'яза вплине на пошкодження комахами (або просто про що-небудь ще, що ви хочете виміряти на деревах в'язів), тому я майже розробив для вас дурний експеримент.
Випадкова вибірка - це та, в якій всі члени населення мають однакову ймовірність вибірки. Якщо ви вимірюєте флуоресценцію всередині клітин нирок, це означає, що всі точки всередині клітини, і всі клітини в нирці, і всі нирки у всіх особин виду матимуть рівні шанси на вибірку.

Абсолютно випадкову вибірку спостережень важко зібрати, і вам потрібно подумати про те, як це може вплинути на ваші результати. Скажімо, ви використовували конфокальний мікроскоп, щоб взяти двовимірний «оптичний зріз» клітини нирок. Було б легко використовувати генератор випадкових чисел на комп'ютері, щоб вибрати деякі випадкові пікселі на зображенні, і ви можете використовувати флуоресценцію в цих пікселів як ваш зразок. Однак, якщо ваш зріз знаходився поблизу клітинної мембрани, ваш «випадковий» зразок не включав би жодних точок глибоко всередині клітини. Однак, якщо ваш фрагмент був прямо через середину клітинки, точки глибоко всередині комірки будуть перепредставлені у вашому зразку. Ви можете отримати більш химерний мікроскоп, щоб ви могли подивитися на випадковий зразок «вокселів» (тривимірних пікселів) по всьому об'єму клітини. Але що б ви зробили з вокселями прямо на поверхні клітини? Включення їх у ваш зразок було б помилкою, оскільки вони можуть включати частину клітинної мембрани та позаклітинного простору, але виключення їх означатиме, що точки біля клітинної мембрани недостатньо представлені у вашому зразку.
Відповідність
Іноді є багато варіацій в заплутаних змінних, які ви не можете контролювати; навіть якщо ви рандомізуєте, велика варіація в заплутаних змінних може спричинити стільки варіацій у вашій залежній змінній, що було б важко виявити різницю, викликану незалежною змінною, яка вас цікавить . Особливо це стосується людини. Скажімо, ви хочете перевірити масло котячої м'яти як засіб від комарів. Якби ви тестували його на щурах, ви отримали б купу щурів того ж віку та статі та інбредний генетичний штам, застосували б до половини з них масло котячої м'яти, потім помістили їх у заповнену комарами кімнату на певний проміжок часу і підрахували кількість укусів комарів. Це був би хороший, добре контрольований експеримент, і при помірній кількості щурів можна було побачити, чи спричинило масло котячої м'яти навіть невелику зміну кількості укусів комарів. Але якби ви хотіли протестувати олію котячої м'яти на людях, які займаються їхнім повсякденним життям, ви не могли б отримати купу людей одного і того ж «інбредного генетичного штаму», було б важко отримати купу людей однакового віку та статі, і люди сильно відрізнялися б тим, де вони жили, скільки часу вони провели. зовні, ароматизовані парфуми, мило, дезодоранти та пральні порошки, які вони використовували, і все інше, що змушує комарів ігнорувати одних людей та їсти інших. Дуже велика різниця в кількості укусів комарів серед людей означатиме, що якби масло котячої м'яти мало ефект, вам знадобиться величезна кількість людей, щоб різниця була статистично значущою.
Один із способів зменшити шум через змішані змінні - це узгодження. Зазвичай це робиться, коли незалежна змінна є номінальною змінною з двома значеннями, такими як «наркотик» проти «плацебо». Ви робите спостереження парами, по одному для кожного значення незалежної змінної, які максимально схожі в змішаних змінних. Пари могли бути різними частинами одних і тих же людей. Наприклад, ви можете перевірити свою олію котячої м'яти, змусивши людей покласти масло котячої м'яти на одну руку, а масло плацебо на іншу руку. Різниця в розмірі різниці між двома руками на кожній людині буде набагато меншою, ніж варіація серед різних людей, тому вам не знадобиться майже такий великий розмір вибірки, щоб виявити невелику різницю в укусах комарів між маслом котячої м'яти та олією плацебо. Звичайно, вам доведеться випадковим чином вибрати, на яку руку покласти масло котячої м'яти.
Інші способи спарювання включають експерименти до і після. Ви можете порахувати кількість укусів комарів за один тиждень, тоді люди вживають олію котячої м'яти і подивитися, чи зменшилася кількість укусів комарів для кожної людини. За допомогою такого роду експерименту важливо переконатися, що залежна змінна не змінилася б сама по собі (можливо, погода змінилася і комарі перестали кусати), тому краще було б використовувати масло плацебо один тиждень, а масло котячої м'яти - ще тиждень, і випадковим чином вибрати для кожної людини, чи є котяча м'ята м'ята м'ята масло або масло плацебо було першим.
Для багатьох людських експериментів вам потрібно буде відповідати двом різним людям, тому що ви не можете перевірити як лікування, так і контроль на одній людині. Наприклад, припустимо, ви відмовилися від олії котячої м'яти як засіб від комарів і збираєтеся перевірити його на людях як профілактику катаракти. Ви збираєтеся отримати купу людей, половина з них прийняти таблетку з котячої м'яти, а половина прийняти таблетку плацебо протягом п'яти років, а потім порівняти непрозорість лінз у двох групах. Тут мета полягає в тому, щоб кожна пара людей була максимально схожою в заплутаних змінних, які, на вашу думку, можуть бути важливими. Якщо ви вивчаєте катаракту, ви хочете, щоб відповідати людям на основі відомих факторів ризику катаракти: вік, кількість часу на відкритому повітрі, використання сонцезахисних окулярів, артеріальний тиск. Звичайно, як тільки у вас є відповідна пара осіб, ви хочете випадковим чином вибрати, який з них отримує масло котячої м'яти, а який отримує плацебо. Ви не зможете знайти ідеально відповідні пари осіб, але чим краще матч, тим легше буде виявити різницю через таблетки з котячої м'яти.
Одним з видів узгодження, який часто використовується в епідеміології, є дослідження кейс-контролю. «Випадки» - це люди з певним захворюванням або станом, і кожен з них поєднується з одним або декількома елементами управління. Кожен контроль, як правило, однієї статі і подібний за іншими факторами (вік, етнічна приналежність, професія, дохід), як практичні. Потім випадки та елементи управління порівнюються, щоб побачити, чи є послідовні відмінності між ними. Наприклад, якщо ви хотіли дізнатися, чи спричиняло куріння марихуани або запобігало катаракті, ви можете знайти купу людей з катарактою. Потім ви знайдете контроль для кожної людини, яка була схожа в відомих факторів ризику для катаракти (вік, час на відкритому повітрі, артеріальний тиск, діабет, використання стероїдів). Тоді ви запитаєте про випадки катаракти, а не-катаракта контролює, скільки бур'янів вони курили.
Якщо важко знайти випадки і легко знайти елементи управління, дослідження кейс-контролю може включати два або більше елементів управління для кожного випадку. Це дає дещо більшу статистичну силу.
Статистичний контроль
Коли непрактично тримати всі можливі змішані змінні постійними, інше рішення - статистично контролювати їх. Іноді зробити це можна за допомогою простого співвідношення. Якщо вас цікавить вплив ваги на катаракту, висота буде заплутаною змінною, тому що більш високі люди, як правило, важать більше. Використання індексу маси тіла (ІМТ), який є співвідношенням ваги в кілограмах над квадратом висоти в метрах, видалить більшу частину заплутаних ефектів висоти у вашому дослідженні. Якщо вам потрібно видалити ефекти декількох змішаних змінних, існують багатовимірні статистичні методи, які ви можете використовувати. Однак аналіз, інтерпретація та презентація складних багатовимірних аналізів непрості.
Спостерігач або упередження суб'єкта як змішана змінна
У багатьох дослідженнях можливий ухил дослідників є однією з найважливіших змішаних змінних. Знайти статистично значущий результат майже завжди цікавіше, ніж не знайти різницю, тому потрібно постійно бути насторожі, щоб контролювати наслідки цього упередженості. Найкращий спосіб зробити це, засліплюючи себе, так що ви не знаєте, які люди отримали лікування, а які отримали контроль. Повертаючись до нашого експерименту з маслом котячої м'яти та комарів, якщо ви знаєте, що Аліса отримала масло котячої м'яти, а Боб - ні, ваша підсвідома мова тіла та тон голосу, коли ви розмовляєте з Алісою, можуть означати: «Ви не отримали дуже багато укусів комарів, чи не так? Це означало б, що світ нарешті дізнається, який я геній за винахід цього», і ви можете ретельно вивчити кожну червону шишку і вирішити, що деякі з них були укусами павуків або отруйним плющем, а не укусами комарів. З Бобом, який отримав плацебо, ви можете підсвідомо мати на увазі «Бідний Боб - я впевнений, що ви отримали тонну укусів комарів, чи не так? Чим більше ви отримали, тим більше я геній», і ви, можливо, більше шансів вважати кожен натяк на шишку на шкірі Боба як укус комара. В ідеалі суб'єкти не повинні знати, чи отримали вони лікування або плацебо, щоб вони не могли дати вам бажаний результат; це особливо важливо для суб'єктивних змінних, таких як біль. Звичайно, тримати суб'єктів цього конкретного уявного експерименту сліпими до того, чи натирають вони масло котячої м'яти на шкіру, буде важко, тому що кішка Аліси продовжує облизувати руку Аліси, а потім діяти камінням.