Skip to main content
LibreTexts - Ukrayinska

13.1.1: Випадковий зразок

  • Page ID
    52625
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Статистики виявили кілька методів уникнення упередженості. Перший полягає в отриманні випадкової вибірки. Коли ви вибірка випадковим чином, ви не віддаєте перевагу жодному члену населення над іншим. Наприклад, відбираючи банки з томатним соусом, ви не вибираєте перші три банки, які бачите.

    Визначення

    Випадкова вибірка - це будь-яка вибірка, отримана методом випадкової вибірки.

    Визначення

    Метод випадкової вибірки - це взяття вибірки з цільової популяції таким чином, щоб будь-який член населення мав рівні шанси бути обраним.

    буфер обміну з папером і олівцем

    Розпізнати значення отримання випадкової вибірки легко, але досягти цієї мети може бути важко. Якщо ви хочете опитувати учнів за їхні погляди на скасування міжвузівської програми легкої атлетики школи в умовах останньої кризи шкільного бюджету, як ви даєте всім рівні шанси бути опитаними? Деякі студенти менш схильні до бажання поговорити з вами, коли ви підходите до них з буфером обміну. Якщо ви задаєте всі свої питання в трьох місцях на кампусі, ви не можете дати рівних шансів студентам, які ніколи не знаходяться в цих місцях. Тоді виникають проблеми з самими питаннями опитування. Спосіб побудови питань може вплинути на відповіді, які ви отримуєте, і тому ви не будете отримувати випадкову вибірку поглядів студентів, навіть якщо ви отримаєте випадкову вибірку студентів.

    Навмисне не використання випадкової вибірки - мабуть, основний спосіб брехати зі статистикою. Наприклад, газети іноді повідомляють, що студенти американських середніх шкіл та середніх шкіл особливо бідні в математиці та науці порівняно з учнями інших країн. Це дивовижне статистичне узагальнення, ймовірно, базується на упередженій вибірці. Цілком вірно, що ті американські студенти, які беруть міжнародні стандартизовані тести з математики та досягнення науки, оцінюють гірше, ніж іноземні студенти. Проблема полягає в тому, що адміністратори шкіл в інших країнах занадто стараються, щоб зробити це добре на цих тестах. «У багатьох країнах добре виглядати дуже добре для міжнародного престижу. Деякі обмежують учнів, які здають тест, елітними школами», - каже Гарольд Ходжкінсон, директор Центру демографічної політики у Вашингтоні та колишній директор Національного інституту освіти. Наприклад, тоді як Сполучені Штати тестують майже всіх своїх студентів, Гонконг цього не робить. До 12-го класу Гонконг усунув усіх, крім 3 відсотків своїх учнів, від прийому математики і, таким чином, від здачі стандартизованих тестів. У Японії лише 12 відсотків учнів 12-го класу беруть будь-яку математику. Канада має особливо хороші результати тестування з тієї ж причини. За словами Ходжкінсона, Сполучені Штати виглядають не так погано, коли ви берете до уваги вищезазначене.

    Наступний уривок описує нестатистичне узагальнення з вибірки. Спробуйте визначити висновок, чисельність населення, вибірку та будь-яку упередженість.

    Девід відправився в продуктовий магазин, щоб дістати три коробки полуниці. Він коротко подивився на верхній шар полуниці в кожній з перших трьох коробок в секції полуниці і не помітив ніякого пуху на ягодах. Впевнений, що ягоди в його трьох коробках були без пушків, він купив всі три.

    червона полуниця

    Висновок Девіда полягав у тому, що полуниця в його коробках не була нечіткою. Його висновок був про популяцію всієї полуниці в трьох картонних коробках. Його зразком був верхній шар полуниці в кожному з них. Девід - довірлива душа, чи не так? Деякі бакалійники заховають всі погані ягоди на дні. Оскільки покупці знають про цей потенційний обман, вони віддають перевагу своїй полуниці в прозорих, перетинчастих коробках. Якби Девід хотів бути впевненим у своєму висновку, він повинен був уважніше дивитися на коробки і відібрати однаково між нижніми, середніми та бічними ягодами теж. Дивлячись на верхню полуницю краще, ніж дивитися на жодну, і дивитися випадково краще, ніж дивитися не випадково.

    Коли ми вибираємо екземпляри новин, щоб зробити висновок про точність звітів новин, ми хочемо, щоб наш зразок був репрезентативним щодо характеристики «містить помилку звітності». Коли ми вибираємо виборців про те, як вони будуть голосувати на наступних виборах, ми хочемо, щоб наш зразок був репрезентативним щодо характеристики «голосування за кандидатів». Ось формальне визначення мети, яка є репрезентативністю:

    Визначення Зразок S - це (ідеально) репрезентативна вибірка з популяції P щодо характеристики C, якщо відсоток S, що є C, точно дорівнює відсотку P, що є C.

    Зразок S менш репрезентативний P відповідно до ступеня, до якого відсоток S, що є С, відхиляється від відсотка P, які є С.

    Якщо ви збираєтеся зробити деякі вибірки, що ви можете зробити, щоб поліпшити свої шанси на отримання репрезентативного зразка? Відповідь - дотримуватися цих чотирьох процедур, якщо ви можете:

    1. Виберіть випадковий зразок.

    2. Підберіть великий зразок.

    3. Підбирайте різноманітний зразок.

    4. Підберіть стратифікований зразок.

    Ми вже обговорювали, як отримати випадкову вибірку. Після того, як ми вивчимо інші три процедури, ми будемо в кращому становищі, щоб зрозуміти, чому іноді може бути помилкою вибрати випадковий зразок.

    Вправа\(\PageIndex{1}\)

    Який найсильніший, а який найслабший аргумент? Чотири аргументи відрізняються лише вживанням слів random і about.

    а. Двадцять відсотків випадкової вибірки студентів нашого університету хочуть, щоб штрафи за бібліотеку були нижчими; отже, 20 відсотків студентів нашого університету хочуть, щоб штрафи за бібліотеку були нижчими.
    б Двадцять відсотків вибірки студентів нашого університету хочуть, щоб штрафи за бібліотеку були нижчими; отже, 20 відсотків студентів нашого університету хочуть, щоб бібліотечні штрафи були нижчими.
    c Двадцять відсотків випадкової вибірки студентів нашого університету хочуть, щоб штрафи за бібліотеку були нижчими; так, близько 20 відсотків студентів нашого університету хочуть, щоб бібліотечні штрафи були нижчими.
    d. двадцять відсотків вибірки студентів нашого університету хочуть, щоб штрафи за бібліотеку були нижчими; так, близько 20 відсотків студентів нашого університету хочуть, щоб бібліотечні штрафи були нижчими.

    Відповідь

    Відповідь (в) найсильніший і (б) найслабший. Слово про у висновках (c) і (d) роблять свої висновки менш точними і, таким чином, швидше за все, будуть правдивими, при інших рівних умовах. З цієї причини аргументи (c) та (d) краще, ніж аргументи (a) та (b). Усередині кожної з цих пар аргумент, приміщення якого говорять про випадкову вибірку, кращий, ніж той, чиї приміщення не говорять про це. Отже (c) краще, ніж (d), а (b) гірше, ніж (а). Відповіді (d) і (b) гірші, тому що вам не вистачає інформації про те, чи є зразки випадковими; однак, якщо не сказати, чи є вони випадковими, не дозволяє зробити висновок, що вони не є випадковими.

    Вправа\(\PageIndex{1}\)

    Для наступного статистичного звіту (а) ідентифікуйте вибірку, (б) ідентифікуйте популяцію, (c) обговоріть якість методу вибірки та (d) знайдіть інші проблеми або з дослідженням, або з вашими знаннями про дослідження.

    Добровільні тести водіїв 25,000 по всій території Сполучених Штатів показали, що 25 відсотків з них вживають деякі наркотики під час водіння і що 85 відсотків взагалі не вживають наркотиків під час водіння. Висновок полягав у тому, що 25 відсотків американських водіїв вживають наркотики під час водіння. Чудовий висновок. Тести проводилися у випадковий час доби у випадково вибраних ресторанах автостради.

    Відповідь

    (a) Вибірка 25,000 американських водіїв, (b) Населення - американські водії, (c) Розмір вибірки досить великий, але це не випадково, з чотирьох причин: (1) Водії, які не зупиняються в придорожніх ресторанах, не мали шансів на вибірку, (2) дослідження переоцінювало водіїв автострад, а не інших водіїв , (3) він переоцінював добровольців, (4) він переоцінював водіїв, які їздять о 4 годині ранку (d) Найбільш очевидною помилкою в опитуванні або в звіті про опитування є те, що 25 відсотків плюс 85 відсотків більше 100 відсотків. Незважаючи на те, що опитування показало, що ці відсотки є приблизними, 110 відсотків все ще занадто високі. Також читач хотів би отримати більше інформації для того, щоб оцінити якість дослідження. Зокрема, як дослідження вирішило, що вважається наркотиком, тобто як воно здійснило концепцію наркотиків? Чи є ці препарати: Аспірин? Кофеїн? Вітаміни? Алкоголь? Тільки незаконні наркотики? Чи запитала анкета, чи вживав водій коли-небудь наркотики під час керування автомобілем, чи коли-небудь вживав наркотики? Чи проводив опитувальник відбір проб в один день або протягом багатьох днів? Все-таки відсутність інформації про обстеження не обов'язково є ознакою помилки в самому опитуванні.