Skip to main content
LibreTexts - Ukrayinska

2.4: Аналіз результатів

  • Page ID
    90507
    • Rose M. Spielman, William J. Jenkins, Marilyn D. Lovett, et al.
    • OpenStax
    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Цілі навчання
    • Поясніть, що коефіцієнт кореляції говорить нам про зв'язок між змінними
    • Визнайте, що кореляція не вказує на причинно-наслідковий зв'язок між змінними
    • Обговоріть нашу тенденцію шукати зв'язки між змінними, які насправді не існують
    • Пояснити випадкову вибірку та призначення учасників в експериментальні та контрольні групи
    • Обговоріть, як упередженість експериментатора або учасника може вплинути на результати експерименту
    • Визначте незалежні та залежні змінні

    Чи знаєте ви, що зі збільшенням продажів морозива зростає і загальний рівень злочинності? Чи можливо, що потурання улюбленому смаку морозива може відправити вас на злочин? Або, після скоєння злочину, як ви думаєте, ви можете вирішити побалувати себе шишкою? Немає сумнівів, що існує зв'язок між морозивом та злочинністю (наприклад, Harper, 2013), але було б досить нерозумно вирішити, що одна річ насправді спричинила інше.

    Набагато більш імовірно, що як продаж морозива, так і рівень злочинності пов'язані з температурою на вулиці. Коли температура тепла, з їхніх будинків багато людей, взаємодіють один з одним, дратуються один з одним, а іноді і скоюють злочини. Крім того, коли на вулиці тепло, ми, швидше за все, шукаємо прохолодне ласощі, як морозиво. Як ми визначаємо, чи дійсно існує зв'язок між двома речами? І коли є стосунки, як ми можемо розрізнити, чи це пов'язано з збігом чи причинним наслідком?

    Кореляційні дослідження

    Кореляція означає, що існує зв'язок між двома або більше змінними (такими як споживання морозива та злочинність), але цей зв'язок не обов'язково передбачає причину та наслідки. Коли дві змінні співвідносяться, це просто означає, що як одна змінна змінюється, так і інша. Ми можемо виміряти кореляцію, обчислюючи статистику, відому як коефіцієнт кореляції. Коефіцієнт кореляції - це число від -1 до +1, яке вказує на силу і напрямок зв'язку між змінними. Коефіцієнт кореляції зазвичай представлений буквою r.

    Числова частина коефіцієнта кореляції вказує на міцність відносин. Чим ближче число до 1 (будь то негативне або позитивне), тим сильніше пов'язані змінні, і тим більш передбачуваними будуть зміни в одній змінній, як зміни іншої змінної. Чим ближче число до нуля, тим слабкіше зв'язок, і тим менш передбачуваними стають відносини між змінними. Наприклад, коефіцієнт кореляції 0,9 вказує на набагато сильніший зв'язок, ніж коефіцієнт кореляції 0,3. Якщо змінні взагалі не пов'язані один з одним, коефіцієнт кореляції дорівнює 0. Наведений вище приклад про морозиво та злочинність є прикладом двох змінних, які ми могли б очікувати, що не мають жодного відношення один до одного.

    Знак - позитивний або негативний - коефіцієнта кореляції вказує напрямок зв'язку (рис. 2.12). Позитивна кореляція означає, що змінні рухаються в одному напрямку. Іншим шляхом, це означає, що як одна змінна збільшується, так і інша, і навпаки, коли одна змінна зменшується, так і інша. Негативна кореляція означає, що змінні рухаються в протилежних напрямках. Якщо дві змінні негативно співвідносяться, зменшення однієї змінної пов'язане зі збільшенням іншої і навпаки.

    Приклад морозива та рівня злочинності є позитивною кореляцією, оскільки обидві змінні збільшуються, коли температура тепліша. Інші приклади позитивних кореляцій - це взаємозв'язок між зростом та вагою людини або взаємозв'язок між віком людини та кількістю зморшок. Можна очікувати негативної кореляції між чиєюсь втомою протягом дня та кількістю годин, які вони спали попередньої ночі: кількість сну зменшується у міру збільшення почуття втоми. У реальному прикладі негативної кореляції студентські дослідники з Університету Міннесоти виявили слабку негативну кореляцію (r = -0.29) між середньою кількістю днів на тиждень, коли студенти отримували менше 5 годин сну та їх середній бал (Lowry, Dean, & Manders, 2010). Майте на увазі, що негативна кореляція не є такою ж, як відсутність кореляції. Наприклад, ми, мабуть, не знайшли б кореляції між годинами сну та розміром взуття.

    Як уже згадувалося раніше, кореляції мають прогнозне значення. Уявіть, що ви перебуваєте в приймальній комісії великого вузу. Ви зіткнулися з величезною кількістю заявок, але ви здатні вмістити лише невеликий відсоток від пулу претендентів. Як ви можете вирішити, кого слід прийняти? Ви можете спробувати співвіднести ваш поточний бал студентів коледжу з їх балами на стандартизованих тестах, таких як SAT або ACT. Спостерігаючи, які кореляції були найсильнішими для ваших нинішніх студентів, ви могли б використовувати цю інформацію, щоб передбачити відносний успіх тих студентів, які подали заявку на вступ до університету.

    Показані три розсіювачі. Scatterplot (a) позначається як «позитивна кореляція» і показує розсіяні точки, що утворюють грубу лінію від нижнього лівого до верхнього правого краю; вісь x позначена «вага», а вісь y позначена «висота». Scatterplot (b) позначений «негативною кореляцією» і показує розсіяні точки, що утворюють грубу лінію з верхнього лівого кута в нижній правий; вісь x позначена «втома», а вісь y позначена «годинами сну». Scatterplot (c) позначений «без кореляції» і показує розсіяні точки, що не мають візерунка; вісь x позначена «розмір взуття», а вісь y позначена «години сну».
    Малюнок 2.12 Scatterplots - це графічне уявлення про силу і напрямок кореляцій. Чим сильніше кореляція, тим ближче точки даних знаходяться до прямої лінії. У цих прикладах ми бачимо, що існує (а) позитивна кореляція між вагою та зростом, (б) негативна кореляція між втомою та годинами сну та (в) відсутність кореляції між розміром взуття та годинами сну.
    Посилання на навчання

    Маніпулюйте цим інтерактивним розсіювачем, щоб практикувати розуміння позитивної та негативної кореляції.

    Кореляція не вказує на причинно-наслідковий зв'язок

    Кореляційні дослідження корисні, оскільки дозволяють виявити силу та напрямок відносин, які існують між двома змінними. Однак кореляція обмежена, оскільки встановлення існування відносин мало говорить нам про причину та наслідок. Хоча змінні іноді корелюють, тому що один викликає інший, це також може бути, що якийсь інший фактор, заплутаний змінна, насправді викликає систематичний рух в наших змінних, що представляють інтерес. У прикладі рівня морозива/злочинності, згаданому раніше, температура є заплутаною змінною, яка може враховувати взаємозв'язок між двома змінними.

    Навіть коли ми не можемо вказати на чіткі змішані змінні, ми не повинні вважати, що кореляція між двома змінними означає, що одна змінна викликає зміни в іншій. Це може бути розчаруванням, коли причинно-наслідкові відносини здаються чіткими та інтуїтивними. Подумайте про наше обговорення досліджень, проведених Американським онкологічним товариством, і про те, як їхні дослідницькі проекти були одними з перших демонстрацій зв'язку між курінням та раком. Здається розумним припустити, що куріння викликає рак, але якби ми обмежилися кореляційними дослідженнями, ми б переступили наші межі, зробивши це припущення.

    На жаль, люди постійно помилково пред'являють претензії на причинно-наслідковий зв'язок як функцію кореляцій. Такі претензії особливо поширені в рекламних оголошеннях і новинних сюжетах. Наприклад, нещодавні дослідження показали, що люди, які їдять зернові на регулярній основі, досягають більш здорової ваги, ніж ті, хто рідко їсть каші (Frantzen, Treviño, Echon, Garcia-Dominic, & DiMarco, 2013; Barton et al., 2005). Вгадайте, як зернові компанії повідомляють про цю знахідку. Чи дійсно вживання крупи змушує людину підтримувати здорову вагу, або є інші можливі пояснення, наприклад, хтось із здоровою вагою частіше їсть здоровий сніданок, ніж той, хто страждає ожирінням, або хтось, хто уникає їжі, намагаючись дієта (рис. 2. 13)? Хоча кореляційні дослідження є неоціненними у виявленні взаємозв'язків між змінними, основним обмеженням є неможливість встановити причинно-наслідковий зв'язок. Психологи хочуть робити заяви про причину і наслідок, але єдиний спосіб зробити це - провести експеримент, щоб відповісти на дослідницьке питання. У наступному розділі описано, як наукові експерименти включають методи, які усувають або контролюють альтернативні пояснення, які дозволяють дослідникам досліджувати, як зміни в одній змінній викликають зміни в іншій змінній.

    На фотографії зображена миска з крупою.
    Малюнок 2.13 Чи справді вживання крупи викликає у когось здорову вагу? (кредит: Тім Скілерн)

    Ілюзорні кореляції

    Спокуса зробити помилкові причинно-наслідкові заяви на основі кореляційних досліджень - це не єдиний спосіб, яким ми схильні неправильно інтерпретувати дані. Ми також схильні робити помилку ілюзорних кореляцій, особливо з безсистемними спостереженнями. Ілюзорні кореляції, або помилкові кореляції, виникають, коли люди вважають, що відносини існують між двома речами, коли таких відносин не існує. Однією з відомих ілюзорних кореляцій є передбачуваний вплив фаз Місяця на поведінку людини. Багато людей пристрасно стверджують, що на поведінку людини впливає фаза Місяця, а конкретно, що люди діють дивно, коли Місяць повний (рис. 2.14).

    На фотографії зображена Місяць.
    Малюнок 2.14 Багато людей вважають, що повний місяць змушує людей поводитися дивно. (кредит: Кори Занкер)

    Не можна заперечувати, що Місяць чинить потужний вплив на нашу планету. Припливи і припливи океану щільно прив'язані до гравітаційних сил Місяця. Тому багато людей вважають, що логічно, що на нас впливає і Місяць. Адже наші тіла багато в чому складаються з води. Мета-аналіз майже 40 досліджень послідовно демонстрував, однак, що взаємозв'язку між місяцем і нашою поведінкою не існує (Rotton & Kelly, 1985). Хоча ми можемо приділяти більше уваги дивній поведінці під час повної фази Місяця, темпи непарної поведінки залишаються постійними протягом усього місячного циклу.

    Чому ми так схильні вірити в ілюзорні кореляції, як це? Часто ми читаємо або чуємо про них і просто приймаємо інформацію як дійсну. Або у нас є думка про те, як щось працює, а потім шукаємо докази, які підтверджують цю здогадку, ігноруючи докази, які б сказали нам, що наша думка є помилковою; це відомо як упередженість підтвердження. В іншому випадку ми знаходимо ілюзорні кореляції на основі інформації, яка найлегше приходить на розум, навіть якщо ця інформація сильно обмежена. І хоча ми можемо відчувати впевненість, що можемо використовувати ці відносини, щоб краще зрозуміти і передбачити навколишній світ, ілюзорні кореляції можуть мати суттєві недоліки. Наприклад, дослідження показують, що ілюзорні кореляції, в яких певна поведінка неточно приписується певним групам, беруть участь у формуванні досудових установок, які в кінцевому підсумку можуть призвести до дискримінаційної поведінки (Fiedler, 2004).

    Причинність: проведення експериментів та використання даних

    Як ви дізналися, єдиний спосіб встановити, що існує причинно-наслідковий зв'язок між двома змінними, - це провести науковий експеримент. Експеримент має інше значення в науковому контексті, ніж у повсякденному житті. У повсякденній розмові ми часто використовуємо його, щоб описати спробу чогось вперше, наприклад, експериментувати з новою зачіскою або новою їжею. Однак в науковому контексті експеримент має точні вимоги до проектування та реалізації.

    Експериментальна гіпотеза

    Для того щоб провести експеримент, дослідник повинен мати конкретну гіпотезу для перевірки. Як ви дізналися, гіпотези можна сформулювати або шляхом безпосереднього спостереження за реальним світом, або після ретельного розгляду попередніх досліджень. Наприклад, якщо ви вважаєте, що використання технологій у класі негативно впливає на навчання, то ви в основному сформулювали гіпотезу, а саме, що використання технологій у класі повинно бути обмежене, оскільки це зменшує рівень навчання. Як ви могли досягти цієї конкретної гіпотези? Можливо, ви помітили, що ваші однокласники, які роблять нотатки на своїх ноутбуках, виконують на нижчих рівнях на класних іспитах, ніж ті, хто робить нотатки вручну, або ті, хто отримує урок через комп'ютерну програму порівняно з особистим викладачем, мають різний рівень продуктивності при тестуванні (рис. 2.15) ).

    Багато рядів учнів знаходяться в класі. Один студент має відкритий ноутбук на своєму столі.
    Малюнок 2.15 Як використання технологій у класі може вплинути на навчання? (кредит: модифікація роботи Миколи Георгієва/Pixabay)

    Такі особисті спостереження часто змушують нас формулювати конкретну гіпотезу, але ми не можемо використовувати обмежені особисті спостереження та анекдотичні докази для суворої перевірки нашої гіпотези. Натомість, щоб з'ясувати, чи реальні дані підтримують нашу гіпотезу, ми повинні провести експеримент.

    Проектування експерименту

    Найосновніша експериментальна конструкція передбачає дві групи: експериментальну групу і контрольну групу. Дві групи призначені для того, щоб бути однаковими, за винятком однієї різниці - експериментальної маніпуляції. Експериментальна група отримує експериментальну маніпуляцію - тобто лікування або змінну, що перевіряється (в даному випадку використання технології) - і контрольна група цього не робить. Оскільки експериментальна маніпуляція є єдиною відмінністю між експериментальною та контрольною групами, ми можемо бути впевнені, що будь-які відмінності між ними пов'язані з експериментальними маніпуляціями, а не випадковістю.

    У нашому прикладі того, як використання технологій повинно бути обмежене в класі, ми маємо експериментальну групу вивчати алгебру за допомогою комп'ютерної програми, а потім перевірити їх навчання. Ми вимірюємо навчання в нашій контрольній групі після того, як вчитель викладає алгебру в традиційному класі. Важливо, щоб контрольна група лікувалася аналогічно експериментальній групі, за винятком того, що контрольна група не отримує експериментальної маніпуляції.

    Нам також потрібно точно визначити або операціоналізувати, як ми вимірюємо вивчення алгебри. Оперативне визначення - це точний опис наших змінних, і це важливо для того, щоб дозволити іншим точно зрозуміти, як і що дослідник вимірює в конкретному експерименті. При оперативному навчанні ми можемо вибрати, щоб подивитися на продуктивність на тесті, що охоплює матеріал, на якому людей навчав вчитель або комп'ютерна програма. Ми також можемо попросити наших учасників узагальнити інформацію, яка щойно була представлена певним чином. Що б ми не визначали, важливо, щоб ми здійснювали навчання таким чином, щоб кожен, хто вперше чує про наше дослідження, точно знав, що ми маємо на увазі під навчанням. Це сприяє здатності людей інтерпретувати наші дані, а також їх здатність повторювати наш експеримент, якщо вони вирішать це зробити.

    Після того, як ми реалізуємо те, що вважається використанням технологій і що вважається навчанням у наших учасників експерименту, нам потрібно встановити, як ми будемо проводити наш експеримент. У цьому випадку ми можемо мати учасників витратити 45 хвилин на вивчення алгебри (або через комп'ютерну програму, або з особистим викладачем математики), а потім дати їм тест на матеріал, охоплений протягом 45 хвилин.

    В ідеалі люди, які оцінюють тести, не знають, хто був призначений до експериментальної або контрольної групи, щоб контролювати упередженість експериментатора. Упередженість експериментатора стосується можливості того, що очікування дослідника можуть перекосити результати дослідження. Пам'ятайте, проведення експерименту вимагає великого планування, і люди, які беруть участь в дослідницькому проекті, мають кровну зацікавленість у підтримці своїх гіпотез. Якби спостерігачі знали, яка дитина в якій групі, це може вплинути на те, як вони інтерпретують неоднозначні відповіді, такі як недбалий почерк або незначні обчислювальні помилки. Будучи сліпими до того, яка дитина в якій групі, ми захищаємо від цих упереджень. Ця ситуація є одним сліпим дослідженням, що означає, що одна з груп (учасників) не знає, в якій групі вони знаходяться (експеримент або контрольна група), тоді як дослідник, який розробив експеримент, знає, які учасники є в кожній групі.

    У подвійному сліпому дослідженні як дослідники, так і учасники сліпі до групових завдань. Чому дослідник хоче провести дослідження, де ніхто не знає, хто в якій групі? Тому що, роблячи це, ми можемо контролювати очікування як експериментатора, так і для учасників. Якщо ви знайомі з ефектом фрази плацебо, ви вже маєте деяке уявлення про те, чому це важливий розгляд. Ефект плацебо виникає, коли очікування чи переконання людей впливають або визначають їх досвід у певній ситуації. Іншими словами, просто очікуючи, що щось станеться, насправді це може зробити.

    Ефект плацебо зазвичай описується з точки зору перевірки ефективності нового препарату. Уявіть, що ви працюєте у фармацевтичній компанії, і ви думаєте, що у вас є новий препарат, який ефективний у лікуванні депресії. Щоб продемонструвати, що ваш препарат ефективний, ви проводите експеримент з двома групами: експериментальна група отримує ліки, а контрольна група - ні. Але ви не хочете, щоб учасники знали, отримували вони препарат чи ні.

    Чому це так? Уявіть, що ви учасник цього дослідження, і ви щойно прийняли таблетку, яка, на вашу думку, поліпшить ваш настрій. Тому що ви очікуєте, що таблетки матимуть ефект, ви можете почувати себе краще просто тому, що ви прийняли таблетку, а не через будь-який препарат, який насправді міститься в таблетці - це ефект плацебо.

    Щоб переконатися, що будь-який вплив на настрій обумовлений препаратом, а не очікуваннями, контрольна група отримує плацебо (в даному випадку цукрову таблетку). Тепер кожен отримує таблетку, і в черговий раз ні дослідник, ні учасники експерименту не знають, хто отримав препарат, а хто отримав цукрову таблетку. Будь-які відмінності в настрої між експериментальною та контрольною групами тепер можна віднести до самого препарату, а не до упередженості експериментатора або очікувань учасників (рис. 2.16).

    На фотографії зображено три скляні пляшки таблеток, позначені як плацебо.
    Малюнок 2.16 Забезпечення контрольної групи лікування плацебо захищає від зміщення, викликаного тривалістю. (кредит: Елейн та Артур Шапіро)

    Незалежні та залежні змінні

    У дослідницькому експерименті ми прагнемо вивчити, чи зміни в одній речі викликають зміни в іншому. Щоб досягти цього, ми повинні звернути увагу на дві важливі змінні або речі, які можна змінити, в будь-якому експериментальному дослідженні: незалежну змінну та залежну змінну. Незалежна змінна маніпулюється або контролюється експериментатором. У добре розробленому експериментальному дослідженні незалежна змінна є єдиною важливою відмінністю між експериментальною та контрольною групами. У нашому прикладі того, як використання технологій в класі впливає на навчання, незалежна змінна - це тип навчання учасників дослідження (рис. 2.17). Залежна змінна - це те, що дослідник вимірює, щоб побачити, скільки ефекту мала незалежна змінна. У нашому прикладі залежна змінна - це навчання, виставлене нашими учасниками.

    Коробка з написом «незалежна змінна: робити нотатки на ноутбуці або вручну» містить фотографію класу учнів з відкритим ноутбуком на одному студентському столі. Стрілка з написом «впливає на зміну...» призводить до другого вікна. Друге поле позначено «залежна змінна: продуктивність за мірою навчання» і має фотографію студента за партою, який проходить тест.
    Малюнок 2.17 В експерименті передбачається, що маніпуляції незалежної змінної призведуть до змін залежної змінної. (кредит: «класна» модифікація роботи Миколи Георгієва/Pixabay; кредитне «замітка»: модифікація роботи КФ/Вікімедіа)

    Очікуємо, що залежна змінна зміниться як функція незалежної змінної. Іншими словами, залежна змінна залежить від незалежної змінної. Хороший спосіб подумати про зв'язок між незалежними та залежними змінними є таке питання: Який вплив незалежна змінна має на залежну змінну? Повертаючись до нашого прикладу, який ефект від викладання уроку через комп'ютерну програму проти особистого інструктора?

    Вибір та призначення експериментальних учасників

    Тепер, коли наше дослідження розроблено, нам потрібно отримати вибірку людей, які слід включити в наш експеримент. У нашому дослідженні беруть участь людські учасники, тому нам потрібно визначити, кого включати. Учасники є суб'єктами психологічного дослідження, і, як випливає з назви, в процесі беруть активну участь особи, які беруть участь в психологічних дослідженнях. Часто психологічні дослідницькі проекти покладаються на студентів коледжів, щоб служити учасниками. Насправді, переважна більшість досліджень у психології підгалузей історично залучала студентів як учасників досліджень (Sears, 1986; Arnett, 2008). Але чи справді студенти коледжів представляють широке населення? Студенти коледжу, як правило, молодші, освіченіші, більш ліберальні та менш різноманітні, ніж загальна чисельність населення. Хоча використання студентів як тестових предметів є прийнятою практикою, покладатися на такий обмежений пул учасників дослідження може бути проблематичним, оскільки важко узагальнити результати для більшої кількості населення.

    Наш гіпотетичний експеримент включає старшокласників, і ми повинні спочатку створити вибірку учнів. Зразки використовуються, оскільки популяції, як правило, занадто великі, щоб розумно залучити кожного члена до нашого конкретного експерименту (рис. 2.18). Якщо можливо, слід використовувати випадкову вибірку (є й інші типи зразків, але для цілей цієї глави ми зупинимося на випадкових вибірках). Випадкова вибірка - це підмножина більшої популяції, в якій кожен член населення має рівні шанси бути обраним. Випадкові зразки є кращими, оскільки, якщо вибірка досить велика, ми можемо бути розумно впевнені, що особи, що беруть участь, є представниками більшої популяції. Це означає, що відсотки характеристик у вибірці - стать, етнічна приналежність, соціально-економічний рівень та будь-які інші характеристики, які можуть вплинути на результати - близькі до цих відсотків у більшій кількості населення.

    У нашому прикладі, припустимо, ми вирішуємо, що наше населення цікавить алгебри студентів. Але всі студенти алгебри дуже велике населення, тому нам потрібно бути більш конкретними; натомість ми можемо сказати, що наше населення цікавить всіх студентів алгебри в певному місті. Ми повинні включати студентів з різних доходів, сімейних ситуацій, рас, етнічних груп, релігій та географічних районів міста. Завдяки цьому більш керованому населенню ми можемо працювати з місцевими школами у виборі випадкової вибірки з близько 200 учнів алгебри, які ми хочемо взяти участь у нашому експерименті.

    Підсумовуючи, оскільки ми не можемо перевірити всіх учнів алгебри в місті, ми хочемо знайти групу близько 200, яка відображає склад цього міста. За допомогою репрезентативної групи ми можемо узагальнити наші висновки для більшої кількості населення, не побоюючись того, що наша вибірка буде упередженою певним чином.

    (a) Фотографія показує пташиний вид натовпу на вулиці. b) На фотографії зображена невелика група дітей.
    Малюнок 2.18 Дослідники можуть працювати з (а) великою популяцією або (б) групою вибірки, яка є підмножиною більшої популяції. (Кредит «натовп»: модифікація роботи Джеймса Крідленда; кредит «студенти»: модифікація роботи Лорі Салліван)

    Тепер, коли ми маємо зразок, наступним кроком експериментального процесу є поділ учасників на експериментальні та контрольні групи шляхом випадкового присвоєння. При випадковому присвоєнні всі учасники мають рівні шанси бути віднесені до будь-якої групи. Існує статистичне програмне забезпечення, яке випадковим чином призначить кожного з учнів алгебри у вибірці або до експериментальної або контрольної групи.

    Випадкове призначення має вирішальне значення для звукового експериментального дизайну. При досить великих вибірках випадкове присвоєння робить малоймовірним наявність систематичних відмінностей між групами. Так, наприклад, було б дуже малоймовірно, що ми отримаємо одну групу, повністю складену з чоловіків, даної етнічної ідентичності або певної релігійної ідеології. Це важливо, тому що якби групи були систематично різними до початку експерименту, ми б не знали походження будь-яких відмінностей, які ми знаходимо між групами: Чи існували відмінності, чи вони були викликані маніпуляціями незалежною змінною? Випадкове присвоєння дозволяє припустити, що будь-які відмінності, що спостерігаються між експериментальною та контрольною групами, є результатом маніпулювання незалежною змінною.

    Посилання на навчання

    Використовуйте цей онлайн-генератор випадкових чисел, щоб дізнатися більше про випадкові вибірки та призначення.

    Питання для розгляду

    Хоча експерименти дозволяють вченим пред'являти причинно-наслідкові претензії, вони не позбавлені проблем. Справжні експерименти вимагають від експериментатора маніпулювати незалежною змінною, і це може ускладнити багато питань, які психологи можуть захотіти вирішити. Наприклад, уявіть, що ви хочете знати, який вплив секс (незалежна змінна) має на просторову пам'ять (залежну змінну). Хоча ви, звичайно, можете шукати відмінності між чоловіками та жінками на завданні, яке охоплює просторову пам'ять, ви не можете безпосередньо контролювати стать людини. Ми класифікуємо цей тип дослідницького підходу як квазіекспериментальний і визнаємо, що за цих обставин ми не можемо пред'являти причинно-наслідкові претензії.

    Експериментатори також обмежені етичними обмеженнями. Наприклад, ви не зможете провести експеримент, призначений для визначення того, чи жорстоке поводження в дитинстві призводить до зниження рівня самооцінки серед дорослих. Щоб провести такий експеримент, вам потрібно випадковим чином призначити деяких експериментальних учасників до групи, яка отримує зловживання, і цей експеримент був би неетичним.

    Інтерпретація експериментальних висновків

    Після збору даних як з експериментальної, так і з контрольної груп проводиться статистичний аналіз, щоб з'ясувати, чи є значущі відмінності між двома групами. Статистичний аналіз визначає, наскільки вірогідна будь-яка знайдена різниця через випадковість (і, отже, не має сенсу). Наприклад, якщо експеримент проводиться щодо ефективності харчової добавки, а ті, хто приймає таблетки плацебо (а не добавки), мають той же результат, що і ті, хто приймає добавку, то експеримент показав, що харчова добавка не є ефективною. Як правило, психологи вважають відмінності статистично значущими, якщо існує менше п'яти відсотків шансів спостерігати за ними, якщо групи насправді не відрізнялися одна від одної. Заявлений інший спосіб, психологи хочуть обмежити шанси пред'явлення «хибнопозитивних» претензій п'ятьма відсотками і менше.

    Найбільшою силою експериментів є здатність стверджувати, що будь-які істотні відмінності у висновках викликані незалежною змінною. Це відбувається тому, що випадковий вибір, випадкове призначення та конструкція, яка обмежує наслідки як упередженості експериментатора, так і очікуваної тривалості учасників, повинні створювати групи, схожі за складом та лікуванням. Тому будь-яка різниця між групами пов'язана з незалежною змінною, і тепер ми можемо нарешті зробити причинно-наслідкове твердження. Якщо ми виявимо, що перегляд жорстокої телевізійної програми призводить до більш жорстокої поведінки, ніж перегляд ненасильницької програми, ми можемо сміливо сказати, що перегляд насильницьких телевізійних програм викликає збільшення прояву насильницької поведінки.

    Дослідження звітності

    Коли психологи завершують дослідницький проект, вони, як правило, хочуть поділитися своїми висновками з іншими вченими. Американська психологічна асоціація (APA) публікує посібник з деталізацією, як написати статтю для подачі в наукові журнали. На відміну від статті, яка може бути опублікована в такому журналі, як Psychology Today, яка орієнтована на загальну аудиторію з інтересом до психології, наукові журнали, як правило, публікують рецензовані журнальні статті, спрямовані на аудиторію професіоналів та науковців, які активно займаються дослідженнями самі.

    Посилання на навчання

    Інтернет-лабораторія письма (OWL) в Університеті Пердью може провести вас через APA написання керівних принципів.

    Рецензовану статтю журналу читають кілька інших вчених (загалом анонімно), які мають досвід у цій темі. Ці рецензенти надають відгуки — як автору, так і редактору журналу — щодо якості проекту. Рецензенти шукають вагоме обґрунтування описаного дослідження, чіткий опис того, як проводилося дослідження, та докази того, що дослідження проводилося етично. Вони також шукають недоліки в дизайні, методах та статистичному аналізі дослідження. Вони перевіряють, чи висновки, зроблені авторами, здаються розумними, враховуючи спостереження, зроблені під час дослідження. Рецензенти також коментують, наскільки цінним є дослідження для просування знань дисципліни. Це допомагає запобігти зайвому дублюванню результатів досліджень у науковій літературі і, певною мірою, гарантує, що кожна дослідницька стаття надає нову інформацію. Зрештою, редактор журналу збере всі відгуки рецензентів і визначить, чи буде стаття опублікована в її поточному стані (рідкісна ситуація), опублікована з ревізіями або не прийнята до публікації.

    Рецензування забезпечує певний ступінь контролю якості психологічних досліджень. Погано задумані або виконані дослідження можуть бути відсіяні, і навіть добре розроблені дослідження можуть бути покращені запропонованими переглядами. Рецензування також гарантує, що дослідження описано досить чітко, щоб дозволити іншим вченим повторити його, тобто вони можуть повторити експеримент, використовуючи різні зразки для визначення надійності. Іноді реплікації передбачають додаткові заходи, які розширюються на первісну знахідку. У будь-якому випадку кожна реплікація служить для надання більшої кількості доказів для підтвердження оригінальних результатів досліджень. Успішні тиражі опублікованих досліджень роблять вчених більш схильними приймати ці висновки, тоді як повторні невдачі, як правило, ставлять під сумнів легітимність оригінальної статті та змушують вчених шукати в іншому місці. Наприклад, це було б великим прогресом у медичній галузі, якби опубліковане дослідження показало, що прийом нового препарату допоміг людям досягти здорової ваги, не змінюючи свій раціон. Але якби інші вчені не змогли повторити результати, твердження оригінального дослідження були б поставлені під сумнів.

    В останні роки зростає занепокоєння з приводу «кризи реплікації», яка вплинула на ряд наукових галузей, включаючи психологію. Деякі з найвідоміших досліджень та вчених створили дослідження, які не змогли повторити інші (як обговорювалося в Shrout & Rodgers, 2018). Насправді навіть відомий вчений, лауреат Нобелівської премії, нещодавно відкинув опубліковану роботу, оскільки їй було важко повторити свої результати (вчений, лауреат Нобелівської премії, Френсіс Арнольд відкидає папір, 3 січня 2020 року). Такі результати спонукали деяких вчених почати працювати разом і більш відкрито, а деякі стверджують, що нинішня «криза» насправді покращує способи ведення науки і як її результати діляться з іншими (Aschwanden, 2018).

    DIG DEEPER: Міф про вакцину-аутизм та ретракція опублікованих досліджень

    Деякі вчені стверджували, що звичайні дитячі вакцини викликають у деяких дітей розвиток аутизму, і, насправді, кілька рецензованих публікацій опублікували дослідження, що висувають ці твердження. Починаючи з початкових звітів, масштабні епідеміологічні дослідження припустили, що щеплення не несуть відповідальності за спричинення аутизму і що набагато безпечніше робити щеплення вашої дитини, ніж ні. Крім того, кілька оригінальних досліджень, які роблять цю претензію, з тих пір були відкликані.

    Опублікована робота може бути скасована, коли дані ставляться під сумнів через фальсифікацію, виготовлення або серйозні проблеми проектування досліджень. Після скасування науковому співтовариству повідомляють, що є серйозні проблеми з оригінальним виданням. Відмова може бути ініційована дослідником, який керував дослідженням, науковими співробітниками, установою, яка працювала дослідником, або редакційною колегією журналу, в якому спочатку була опублікована стаття. У випадку вакцина-аутизм ретракція була зроблена через значний конфлікт інтересів, в якому провідний дослідник мав фінансову зацікавленість у встановленні зв'язку між дитячими вакцинами та аутизмом (Offit, 2008). На жаль, початкові дослідження отримали стільки уваги ЗМІ, що багато батьків у всьому світі стали вагатися робити щеплення своїх дітей (рис. 2.19). Постійна залежність від таких розвінчаних досліджень має значні наслідки. Наприклад, у період з січня по жовтень 2019 року в Сполучених Штатах було 22 спалахи кору та понад тисячу випадків зараження кором (Patel et al., 2019). Це, ймовірно, пов'язано з антивакцинальними рухами, які піднялися в результаті розвінчаних досліджень. Для отримання додаткової інформації про те, як розгорталася історія вакцини/аутизму, а також наслідки цієї історії, погляньте на книгу Пола Оффіта «Фальшиві пророки аутизму: погана наука, ризикована медицина та пошук ліків».

    На фотографії зображена дитина, якій роблять пероральну вакцину.
    Малюнок 2.19 Деякі люди все ще вважають, що щеплення викликають аутизм. (кредит: модифікація роботи ЮНІСЕФ Sverige)

    Надійність і валідність

    Надійність та достовірність - це два важливі міркування, які повинні бути зроблені при будь-якому типі збору даних. Надійність відноситься до здатності послідовно видавати заданий результат. У контексті психологічних досліджень це означатиме, що будь-які інструменти чи інструменти, що використовуються для збору даних, роблять це послідовно, відтворюваними способами. Існує ряд різних видів надійності. Деякі з них включають в себе між-ратерну надійність (ступінь, в якій два або більше різних спостерігачів погоджуються з тим, що було помічено), внутрішню послідовність (ступінь, в якій різні пункти опитування, які вимірюють одне і те ж саме, співвідносяться один з одним), і тестовий повторний тест надійності (ступінь, до якої результати конкретного заходу залишаються послідовними у кількох адміністраціях).

    На жаль, бути послідовним у вимірюванні не обов'язково означає, що ви правильно виміряли щось. Щоб проілюструвати цю концепцію, розглянемо кухонну шкалу, яка використовувалася б для вимірювання ваги крупи, яку ви їсте вранці. Якщо шкала не відкалібрована належним чином, вона може постійно знижувати або завищувати кількість зернових, що вимірюється. Хоча шкала є дуже надійною в отриманні послідовних результатів (наприклад, однакова кількість крупи, вилитої на шкалу, щоразу дає однакові показники), ці результати є неправильними. Саме тут вступає в дію дійсність. Термін дії стосується того, наскільки даний інструмент або інструмент точно вимірює те, що він повинен виміряти, і ще раз, є ряд способів, за допомогою яких може бути виражена дійсність. Екологічна обґрунтованість (ступінь, до якої результати досліджень узагальнюють для реальних застосувань), дійсність конструкції (ступінь, до якої дана змінна фактично фіксує або вимірює те, що вона призначена для вимірювання) та валідність особи (ступінь, до якої дана змінна здається дійсною на поверхні) - це лише мало типів, які розглядають дослідники. Хоча будь-яка дійсна міра за потребою надійна, зворотне не обов'язково вірно. Дослідники прагнуть використовувати інструменти, які є одночасно високонадійними і дійсними.

    ЩОДЕННЕ З'ЄДНАННЯ: Наскільки дійсні SAT і ACT?

    Стандартизовані тести, такі як SAT та ACT, повинні вимірювати здатність людини до освіти в коледжі, але наскільки надійними та дійсними є такі тести? Дослідження, проведене Радою коледжу, показують, що бали на SAT мають високу прогнозну валідність для студентів першого курсу GPA (Кобрин, Паттерсон, Шоу, Маттерн, & Barbuti, 2008). У цьому контексті прогнозна обгрунтованість відноситься до здатності тесту ефективно прогнозувати середній бал першокурсників коледжу. Враховуючи, що багато вищих навчальних закладів вимагають SAT або ACT для вступу, цей високий ступінь прогнозної дійсності може бути втішним.

    Однак акцент, зроблений на SAT або ACT балів у вступі до коледжу породив деякі суперечки на ряді фронтів. По-перше, деякі дослідники стверджують, що ці тести є упередженими і ставлять студентів меншин у невигідне становище і несправедливо зменшує ймовірність вступу до коледжу (Santelices & Wilson, 2010). Крім того, деякі дослідження припустили, що прогнозна обгрунтованість цих тестів сильно перебільшена в тому, наскільки добре вони здатні передбачити середній бал студентів першого курсу коледжу. Насправді, було припущено, що прогнозна дійсність SAT може бути завищена на цілих 150% (Rothstein, 2004). Багато закладів вищої освіти починають розглядати де-підкреслюючи значення балів SAT у прийнятті рішень про прийом (Rimer, 2008).

    Останні приклади резонансних скандалів з обману як всередині країни, так і за кордоном лише посилили увагу, що проводиться на цих видах тестів, і станом на березень 2019 року понад 1000 вищих навчальних закладів або послабили, або усунули вимоги до тестування SAT або ACT для вступу ( Штраус, 2019, 19 березня).