Skip to main content
LibreTexts - Ukrayinska

13.1.5: Статистичне значення

  • Page ID
    52638
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Нерідко висновки індуктивних узагальнень є простими статистичними твердженнями. Наша передумова - «х відсоток зразка - ла-де-да». З цього ми робимо висновок: «Той самий відсоток населення теж». Коли аргумент індуктивно сильний, статистики кажуть, що відсоток є статистично значущим, оскільки ця статистика є такою, яка, ймовірно, не пов'язана з випадковістю. Число не повинно бути значним у сенсі бути важливим; це нетехнічне значення слова значне.

    Припустимо, ви зацікавлені у визначенні відсотка лівшів в світі, і ви не готові довіряти результатам інших людей, які здогадалися на цей відсоток. Якщо у вас немає глибокого розуміння генетичної основи лівші, вам доведеться отримати відповідь від вибірки. Вам доведеться взяти зразок і використовувати частку людей у вашому зразку, які є лівшами, як ваше здогадка про значення цільового числа. Цільовий номер - це те, що статистики називають параметром. Число, яке ви використовуєте для вгадування параметра, називається статистикою. Ваша статистика повинна відповідати вищим стандартам, тим впевненіше ви повинні бути, що це надійна оцінка параметра.

    Я якось сказав своєму семирічному синові Джошуа, що він незвичний, тому що він лівша. Це його здивувало, тому він вирішив перевірити, чи правильно я. У складній термінології математичної статистики ми б сказали, що мета Джошуа полягала в тому, щоб визначити, чи є певний параметр, відсоток лівшів у всьому світі, набагато менше 50 відсотків. Ось що зробив Джошуа, щоб отримати статистику для оцінки параметра. Він сказав: «Ти лівша, тато. Мама і моя маленька сестра - ні. Це два і два». Що Джошуа щойно зробив, більш-менш, полягав у тому, щоб взяти вибірку з чотирьох з величезного населення Землі, виявити, що два з чотирьох є лівшами, а потім обчислити статистику 50 відсотків як його здогадка про параметр. Статист сказав би, що статистика Джошуа не є значною, оскільки вибірка занадто мала. Якби Джошуа взяв більшу вибірку, отримане статистичне твердження було б більш правдоподібним.

    Тож Джошуа вирішив отримати більший зразок. Він запитав усіх дітей в його класі в школі, чи є вони лівшами. Два з двадцяти двох. Він також обійшов околиці, запитуючи, кого він міг. Новим результатом з дому, школи та сусідства стали сім лівшів із тридцяти семи. Ця статистика більш схильна бути значною, і вона набагато менше 50 відсотків. Мораль тут полягає в тому, що чим більший розмір вибірки, тим впевненіше ви можете бути, що обчислена статистика є статистично значущою. Чим більше вибірки, тим менше ймовірність того, що результат обумовлений випадковістю. Візерунки, які з'являються у невеликих зразках, можуть зникнути зі збільшенням розміру вибірки; вони можуть бути показані випадковими. Значні закономірності та значні статистичні дані - це ті, які, ймовірно, не будуть випадковими чи випадковими; вони, ймовірно, будуть виявлені при обстеженні більшої частини цільової групи населення.

    Ми досі не відповіли на питання про те, чи є статистика Джошуа 7/37 статистично значущою. Це? Це, безумовно, краще здогадатися, ніж 2/4, але для обчислення того, чи є вона значною, вимагає деяких складних міркувань, що включають складні формули про межі помилки та рівні впевненості, які ми не будемо переслідувати тут. Ми можемо, однак, накидати три особливості відповіді.

    По-перше, похибка: нам потрібно вирішити, наскільки точними ми хочемо, щоб наша здогадка була. Чи можемо ми задовольнятися точністю плюс-мінус 10 відсотків, або нам потрібен менший запас, скажімо плюс-мінус 1 відсоток? По-друге, рівень довіри. Чи готові ми бути лише 95 відсотків впевнені, що маємо правильну відповідь, навіть допускаючи похибку? Або ми повинні бути впевнені на 99 відсотків? За інших рівних умов, чим впевненіше нам потрібно бути, тим менш значущою буде зібрана нами статистика. По-третє, наскільки упередженим був відбір проб? Це було випадковим? Чи було воно різноманітним? Розмір населення, як правило, не є чимось, що потрібно враховувати, якщо чисельність населення велика порівняно з розміром вибірки.