Глосарій
Слова (або слова, які мають однакове визначення) | Визначення чутливе до регістру | (Додатково) Зображення для відображення з визначенням [Не відображається в глосарії, лише у спливаючому вікні на сторінках] | (Додатково) Підпис для зображення | (Необов'язково) Зовнішнє або внутрішнє посилання | (Необов'язково) Джерело для визначення |
---|---|---|---|---|---|
(Наприклад. «Генетичні, спадкові, ДНК...») | (Наприклад. «Відноситься до генів або спадковості») | ![]() |
Сумнозвісна подвійна спіраль | https://bio.libretexts.org/ | CC-BY-SA; Дельмар Ларсен |
Аналіз Вардельмара
Слово (и) | Визначення | Зображення | Підпис | Посилання | Джерело |
---|---|---|---|---|---|
Аналіз дисперсії, аналіз Вардельмара | також називають ANOVA, це метод тестування, чи рівні засоби трьох або більше популяцій. Метод застосовується, якщо: (1) всі зацікавлені популяції зазвичай розподілені. (2) популяції мають однакові стандартні відхилення. (3) зразки (не обов'язково однакового розміру) вибираються випадковим чином і незалежно від кожної популяції. (4) Тестова статистика для аналізу дисперсії - цеF -співвідношення. | OpenStax | |||
Середній | число, яке описує центральну тенденцію даних; існує ряд спеціалізованих середніх, включаючи середнє арифметичне, середньозважене, медіану, моду та середнє геометричне. | OpenStax | |||
Випробування Бернуллі | експеримент з наступними характеристиками: (1) Є лише два можливі результати, які називаються «успіх» та «невдача» для кожного випробування. (2)p Імовірність успіху однакова для будь-якого випробування (тому ймовірністьq=1−p невдачі однакова для будь-якого судового розгляду). | OpenStax | |||
Біноміальний розподіл | дискретна випадкова величина (RV), яка виникає в результаті випробувань Бернуллі. Є фіксована кількістьn, незалежних випробувань. «Незалежний» означає, що результат будь-якого судового розгляду (наприклад, судового розгляду 1) не впливає на результати наступних випробувань, і всі випробування проводяться в однакових умовах. За цих обставин біноміальний RV визначається як кількість успіхів уn випробуваннях. Позначення таке:X∼B(n,p)μ=np а стандартне відхилення єσ=√npq. Імовірність точноx успіхів уn випробуваннях єP(X = x) = \binom{n}{x} p^{x}q^{n-x}. | OpenStax | |||
Біноміальний експеримент | статистичний експеримент, який задовольняє наступним трьом умовам: (1) Існує фіксована кількість випробуваньn. (2) Є лише два можливі результати, які називаються «успіх» та «невдача» для кожного випробування. Букваp позначає ймовірність успіху на одному випробуванні, іq позначає ймовірність невдачі на одномуn випробуванні. (3) Випробування незалежні і повторюються з використанням однакових умов. | OpenStax | |||
Біноміальний розподіл ймовірностей | дискретна випадкова величина (RV), яка виникає з випробувань Бернуллі; є фіксоване числоn, незалежних випробувань. «Незалежний» означає, що результат будь-якого судового розгляду (наприклад, пробного) не впливає на результати наступних випробувань, і всі судові розгляди проводяться в однакових умовах. За цих обставин біноміальний RVX визначається як кількість успіхів уn випробуваннях. Позначення це:X ~ B(n, p). Середнє значення є\mu = np і стандартне відхилення є\sigma = \sqrt{npq}. Імовірність точноx успіхів уn випробуваннях єP(X = x) = {n \choose x}p^{x}q^{n-x}. | OpenStax | |||
осліплення | не повідомляючи учасникам, яке лікування отримує суб'єкт | OpenStax | |||
Коробка сюжету | графік, який дає швидке уявлення про середні 50% даних | OpenStax | |||
Категорична змінна | змінні, які приймають значення, які є іменами або мітками | OpenStax | |||
Центральна гранична теорема | Враховуючи випадкову величину (RV) з відомим середнім\mu і відомим стандартним відхиленням\sigman, ми проводимо вибірку з розміром, і нас цікавлять два нових RV: середнє значення вибірки та сума вибірки\sum X.\bar{X} Якщо розмір (n) зразка досить великий, то\bar{X} \sim N\left(\mu, \dfrac{\sigma}{\sqrt{n}}\right) і\sum X \sim N(n\mu, (\sqrt{n})(\sigma)). Якщо розмір (n) вибірки досить великий, то розподіл засобів вибірки і розподіл сум вибірки будуть наближатися до нормальних розподілів незалежно від форми сукупності. Середнє значення вибіркових засобів дорівнюватиме середньому чисельності населення, а середнє значення сум вибіркиn дорівнюватиме середньому населенню. Стандартне відхилення розподілу засобів вибірки\dfrac{\sigma}{\sqrt{n}}, називається стандартною похибкою середнього. | OpenStax | |||
Центральна гранична теорема | Дано випадкову величину (RV) з відомим середнім\mu і відомим стандартним відхиленням\sigma. Ми проводимо вибірку з розміромn і нас цікавлять два нових RV - середнє значення вибірки\bar{X}, і сума вибірки,\sum X. Якщо розмірn зразка досить великий, то\bar{X} - N\left(\mu, \frac{\sigma}{\sqrt{n}}\right) і\sum X - N \left(n\mu, \sqrt{n}\sigma\right). Якщо розмір n вибірки досить великий, то розподіл засобів вибірки і розподіл сум вибірки будуть наближатися до нормального розподілу незалежно від форми сукупності. Середнє значення вибіркових засобів дорівнюватиме середньому населенню, а середнє значення сум вибіркиn дорівнюватиме середньому населенню. Стандартне відхилення розподілу засобів вибірки\frac{\sigma}{\sqrt{n}}, називається стандартною похибкою середнього. | OpenStax | |||
Кластерна вибірка | метод вибору випадкової вибірки і поділу популяції на групи (кластери); використовувати просту випадкову вибірку для вибору набору кластерів. Кожна людина в обраних кластерах включається до вибірки. | OpenStax | |||
коефіцієнт кореляції | міра, розроблена Карлом Пірсоном (початок 1900-х), яка дає силу зв'язку між незалежною змінною та залежною змінною; формула:r = \dfrac{n \sum xy - \left(\sum x\right) \left(\sum y\right)}{\sqrt{\left[n \sum x^{2} - \left(\sum x\right)^{2}\right] \left[n \sum y^{2} - \left(\sum y\right)^{2}\right]}} деn кількість точок даних. Коефіцієнт не може бути більше 1 або менше —1. Чим ближче коефіцієнт до ± 1, тим сильніше свідчать про значну лінійну залежність міжx іy. | OpenStax | |||
Умовна ймовірність | ймовірність того, що подія відбудеться з огляду на те, що інша подія вже сталася | OpenStax | |||
Довірчий інтервал (CI) | інтервальна оцінка для невідомого параметра популяції. Це залежить від: (1) бажаного рівня довіри. (2) Відомості про розподіл (наприклад, відоме стандартне відхилення). (3) Вибірка та його розмір. | OpenStax | |||
Рівень довіри (CL) | процентний вираз для ймовірності того, що довірчий інтервал містить істинний параметр популяції; наприклад, якщоCL = 90%, то в 90 з 100 вибірок інтервальну оцінку буде укладати істинний параметр популяції. | OpenStax | |||
таблиця надзвичайних ситуацій | метод відображення частотного розподілу у вигляді таблиці з рядками і стовпцями, щоб показати, як дві змінні можуть бути залежними (залежними) один від одного; таблиця надає простий спосіб обчислення умовних ймовірностей. | OpenStax | |||
Безперервна випадкова величина | випадкова величина (RV), результати якої вимірюються; висота дерев у лісі є безперервним RV. | OpenStax | |||
Контрольна група | група в рандомізованому експерименті, яка отримує неактивне лікування, але в іншому випадку управляється точно так само, як і інші групи | OpenStax | |||
Зручність вибірки | невипадковий метод відбору вибірки; цей метод відбирає осіб, які легко доступні і можуть призвести до упереджених даних. | OpenStax | |||
Накопичувальна відносна частота | Термін застосовується до впорядкованого набору спостережень від найменшого до найбільшого. Сукупна відносна частота - це сума відносних частот для всіх значень, які менше або рівні заданому значенню. | OpenStax | |||
Дані | сукупність спостережень (сукупність можливих результатів); більшість даних можна помістити в дві групи: якісні (атрибут, значення якого позначається міткою) або кількісні (атрибут, значення якого позначається числом). Кількісні дані можна розділити на дві підгрупи: дискретні і неперервні. Дані дискретні, якщо це результат підрахунку (наприклад, кількість учнів даної етнічної групи в класі або кількість книг на полиці). Дані є безперервними, якщо це результат вимірювання (наприклад, пройдена відстань або вага багажу) | OpenStax | |||
параметр розпаду | Параметр розпаду описує швидкість, з якою ймовірності падають до нуля для збільшення значеньx. Це значенняm в функціїf(x) = me^{(-mx)} щільності ймовірності експоненціальної випадкової величини. Вона також дорівнює томуm = \dfrac{1}{\mu}, де\mu знаходиться середнє значення випадкової величини. | OpenStax | |||
Ступені свободи (df) | кількість об'єктів у зразку, які вільно варіюються. | OpenStax | |||
Залежні події | Якщо дві події НЕ є незалежними, то ми говоримо, що вони залежні. | OpenStax | |||
Дискретна випадкова величина | випадкова величина (RV), результати якої підраховуються | OpenStax | |||
Подвійне сліпуче | акт засліплення як суб'єктів експерименту, так і дослідників, які працюють з суб'єктами | OpenStax | |||
Однаково ймовірно | Кожен результат експерименту має однакову ймовірність. | OpenStax | |||
Помилка прив'язана до середнього значення популяції (EBM) | похибка; залежить від рівня довіри, розміру вибірки та відомого або передбачуваного стандартного відхилення населення. | OpenStax | |||
Помилка прив'язана до пропорції населення (EBP) | похибка; залежить від рівня довіри, розміру вибірки та оцінюваної (від вибірки) частки успіхів. | OpenStax | |||
Подія | підмножина множини всіх результатів експерименту; множина всіх результатів експерименту називається простором вибірки і зазвичай позначається символомS. Подія є довільною підмножиною вS. Він може містити один результат, два результати, відсутність результатів (порожня підмножина), весь простір вибірки тощо. Стандартними позначеннями для подій є великі літери типуA, B, C, і так далі. | OpenStax | |||
Очікувана вартість | очікуване середнє арифметичне, коли експеримент повторюється багато разів; також називається середнім. Позначення:\mu. Для дискретної випадкової величини (RV) з функцієюP(x) розподілу ймовірностей визначення також може бути записано у вигляді\mu = \sum{xP(x)}. | OpenStax | |||
Експеримент | планова діяльність, що здійснюється в контрольованих умовах | OpenStax | |||
Експериментальна одиниця | будь-яка фізична особа або об'єкт, що підлягає вимірюванню | OpenStax | |||
Пояснювальна змінна | незалежна змінна в експерименті; значення, контрольоване дослідниками | OpenStax | |||
Експоненціальний розподіл | безперервна випадкова величина (RV), яка з'являється, коли ми зацікавлені в інтервалах часу між деякими випадковими подіями, наприклад, тривалість часу між надзвичайними прибуття в лікарню; позначення єX \sim \text{Exp}(m). Середнє значення є\mu = \frac{1}{m} і стандартне відхилення є\sigma = \frac{1}{m}. Функція щільності ймовірності єf(x) = me^{-mx},x \geq 0 а функція кумулятивного розподілу -P(X \leq x) = 1 − e^{mx}. | OpenStax | |||
Перший квартиль | значення, яке є медіаною нижньої половини впорядкованого набору даних | OpenStax | |||
Частота | кількість разів виникає значення даних | OpenStax | |||
Багатокутник частоти | виглядає як лінійний графік, але використовує інтервали для відображення діапазонів великих обсягів даних | OpenStax | |||
Таблиця частот | представлення даних, в якому згруповані дані відображаються разом з відповідними частотами | OpenStax | |||
Геометричний розподіл | дискретна випадкова величина (RV), яка виникає в результаті випробувань Бернуллі; випробування повторюються до першого успіху. XГеометрична змінна визначається як кількість випробувань до першого успіху. Позначення:X \sim G(p). Середнє значення є\mu = \dfrac{1}{p} і стандартне відхилення є\sigma = \sqrt{\dfrac{1}{p}\left(\dfrac{1}{p} - 1\right)}. Імовірність самеx невдач перед першим успіхом задається формулою:P(X = x) = p(1 –p)^{x-1}. | OpenStax | |||
Геометричний експеримент | статистичний експеримент з наступними властивостями: (1) Є одне або кілька випробувань Бернуллі з усіма невдачами, крім останнього, який є успішним. (2) Теоретично кількість випробувань може тривати назавжди. Має бути принаймні одне випробування. (3) Імовірність успіху та ймовірності невдачі неq змінюються від судового розгляду до судового розглядуp | OpenStax | |||
Гіпергеометричний експеримент | статистичний експеримент з наступними властивостями: (1) Ви берете зразки з двох груп. (2) Вас цікавить група, яка називається першою групою. (3) Ви вибірку без заміни з комбінованих груп. (4) Кожен вибір не є незалежним, оскільки вибірка проводиться без заміни. (5) Ви не має справу з випробуваннями Бернуллі. | OpenStax | |||
Гіпергеометрична ймовірність | дискретна випадкова величина (RV), яка характеризується: (1) фіксованою кількістю випробувань. (2) Імовірність успіху не однакова від випробування до судового розгляду. Ми вибірки з двох груп предметів, коли нас цікавить лише одна група. Xвизначається як кількість успіхів із загальної кількості обраних предметів. r =Позначення:X \sim H(r, b, n), де кількість позицій в групі цікавить,b = кількість елементів в групі не цікавить, іn = кількість обраних елементів. | OpenStax | |||
гіпотеза | твердження про значення параметра популяції, в разі двох гіпотез твердження, яке вважається істинним, називається нульовою гіпотезою (нотацієюH_{0}) і суперечливе твердження називається альтернативною гіпотезою (нотацієюH_{a}). | OpenStax | |||
Тестування гіпотез | Виходячи з зразкових доказів, процедура визначення того, чи є викладена гіпотеза розумним твердженням і не повинна бути відхилена, або є необґрунтованою і повинна бути відхилена. | OpenStax | |||
Незалежні заходи | Виникнення однієї події ніяк не впливає на ймовірність виникнення іншої події. Події\text{A} і\text{B} є незалежними, якщо виконується одне з наведених нижче пунктів: (1)P(\text{A|B}) = P(\text{A}), (2)P(\text{B|A}) = P(\text{B}), (3)P(\text{A AND B}) = P(\text{A})P(\text{B}) | OpenStax | |||
Статистика висновків | також називається статистичним висновком або індуктивною статистикою; ця грань статистики стосується оцінки параметра популяції на основі вибіркової статистики. Наприклад, якщо чотири з 100 вибіркових калькуляторів несправні, ми можемо зробити висновок, що чотири відсотки виробництва є дефектними. | OpenStax | |||
Інформована згода | Будь-який суб'єкт людини в дослідницькому дослідженні повинен усвідомлювати будь-які ризики або витрати, пов'язані з дослідженням. Суб'єкт має право знати характер процедур, включених у дослідження, їх потенційні ризики та їх потенційні переваги. Згода повинна надаватися вільно інформованим, придатним учасником. | OpenStax | |||
Інституційна оглядова рада | комітет, якому доручено здійснювати контроль за дослідницькими програмами, які стосуються людських суб'єктів | OpenStax | |||
Інтервал | також називається інтервалом класів; інтервал представляє діапазон даних і використовується при відображенні великих наборів даних | OpenStax | |||
Рівень значущості тесту | ймовірність помилки I типу (відхилити нульову гіпотезу, коли вона істинна). Позначення:\alpha. У тестуванні гіпотез Рівень значущості називається упередженим\alpha або попередньо встановленим\alpha. | OpenStax | |||
Змінна ховається | змінна, яка впливає на дослідження, хоча це ні пояснювальна змінна, ні змінна відповідь | OpenStax | |||
Середнє | число, яке вимірює центральну тенденцію; загальною назвою для середнього є «середній». Термін «середнє» - це скорочена форма «середнє арифметичне». За визначенням, середнє значення для вибірки (позначається\bar{x}) є\bar{x} = \dfrac{\text{Sum of all values in the sample}}{\text{Number of values in the sample}}, а середнє для популяції (позначається\mu) -\mu = \dfrac{\text{Sum of all values in the population}}{\text{Number of values in the population}}. | OpenStax | |||
Середнє значення розподілу ймовірностей | довгострокове середнє значення багатьох випробувань статистичного експерименту | OpenStax | |||
Медіана | число, яке розділяє впорядковані дані навпіл; половина значень - це те саме число або менше медіани, а половина значень - те саме число або більше медіани. Медіана може бути частиною даних, а може і не бути. | OpenStax | |||
майно, що не запам'ятовується | Для експоненціальної випадковоїX величини властивість memoryless - це твердження про те, що знання того, що сталося в минулому, не впливає на майбутні ймовірності. Це означає, що ймовірність, якаX перевищуєx + k, враховуючи, що вона перевищилаx, така ж, як і ймовірність, яка перевищилаX б,k якби ми не мали про це знань. У символах ми говоримо, щоP(X > x + k | X > x) = P(X > k) | OpenStax | |||
Середина | середнє значення інтервалу в таблиці частот | OpenStax | |||
Режим | значення, яке найчастіше з'являється в наборі даних | OpenStax | |||
Взаємовиключні | Дві події є взаємовиключними, якщо ймовірність того, що вони обидва відбуваються одночасно, дорівнює нулю. Якщо події\text{A} і\text{B} є взаємовиключними, тоP(\text{A AND B}) = 0. | OpenStax | |||
Помилка без дискретизації | проблема, яка впливає на надійність даних вибірки, крім природних змін; вона включає різні людські помилки, включаючи поганий дизайн дослідження, упереджені методи вибірки, неточну інформацію, надану учасниками дослідження, помилки введення даних та поганий аналіз. | OpenStax | |||
Нормальний розподіл | безперервна випадкова величина (RV) з pdff(x) = \dfrac{1}{\sigma \sqrt{2 \pi}}e^{\dfrac{-(x-\mu)^{2}}{2 \sigma^{2}}}, де\mu середнє значення розподілу і\sigma є стандартним відхиленням; позначення:X \sim N(\mu, \sigma). Якщо\mu = 0 і\sigma = 1, то РВ називається стандартним нормальним розподілом. | OpenStax | |||
Чисельна змінна | змінні, які приймають значення, які позначаються числами | OpenStax | |||
Одностороння ANOVA | метод перевірки того, чи рівні засоби трьох або більше популяцій; метод застосовується, якщо: (1) всі зацікавлені популяції зазвичай розподілені. (2) популяції мають рівні стандартні відхилення. (3) зразки (не обов'язково однакового розміру) вибираються випадковим чином і незалежно від кожної популяції. (4) Тестова статистика для аналізу дисперсії - цеF коефіцієнт. | OpenStax | |||
Результат | конкретний результат експерименту | OpenStax | |||
викиди | спостереження, яке не відповідає решті даних | OpenStax | |||
p-значення | ймовірність того, що подія відбудеться чисто випадково, припускаючи, що нульова гіпотеза вірна. Чим меншеp -значення, тим сильніше докази проти нульової гіпотези. | OpenStax | |||
Парний набір даних | два набори даних, які мають відношення один до одного, так що: (1) обидва набори даних мають однаковий розмір, і (2) кожна точка даних в одному наборі даних збігається з точно однією точкою з іншого набору. | OpenStax | |||
Параметр | число, яке використовується для представлення характеристики популяції і які, як правило, не можуть бути визначені легко | OpenStax | |||
Параметр | числова характеристика популяції | OpenStax | |||
Плацебо | неактивне лікування, яке не має реального впливу на пояснювальну змінну | OpenStax | |||
Оцінка точки | єдине число, обчислене з вибірки і використовується для оцінки параметра популяції | OpenStax | |||
розподіл Пуассона | Якщо є відоме середнє значення\lambda подій, що відбуваються в одиницю часу, і ці події незалежні один від одного, то кількість подій,X що відбуваються в одній одиниці часу, має розподіл Пуассона. Імовірність k подій, що відбуваються за одну одиницю часу, дорівнюєP(X = k) = \dfrac{\lambda^{k}e^{-\lambda}}{k!}. | OpenStax | |||
Розподіл ймовірностей Пуассона | дискретна випадкова величина (RV), яка підраховує кількість разів, коли певна подія відбудеться в певному інтервалі; характеристики змінної: (1) Імовірність того, що подія відбувається в заданому інтервалі однакова для всіх інтервалів. (2) Події відбуваються з відомим середнім і незалежно від часу з моменту останньої події. Розподіл визначається середнім\mu значенням події в інтервалі. Позначення:X \sim P(\mu). Середнє значення є\mu = np. Стандартне відхилення - це\sigma = \sqrt{\mu}. Імовірність того, що точноx успіхи уr випробуваннях єP(X = x) = \left(e^{-\mu}\right)\frac{\mu^{x}}{x!}. Розподіл Пуассона часто використовується для наближення біноміального розподілу, колиn є «великим» іp «малим» (загальне правило полягає в тому, щоn повинно бути більше або дорівнює 20 іp повинно бути менше або дорівнює 0,05). | OpenStax | |||
Об'єднана пропорція | оцінка загальної вартостіp_{1} іp_{2}. | OpenStax | |||
Населення | всі особи, об'єкти або вимірювання, властивості яких вивчаються | OpenStax | |||
Імовірність | число між нулем і одиницею включно, що дає ймовірність того, що відбудеться конкретна подія | OpenStax | |||
Імовірність | число між нулем і одиницею, включно, що дає ймовірність того, що відбудеться конкретна подія; основу статистики дають наступні 3 аксіоми (А.Н.Колмогорова, 1930-е рр.): ДавайтеS позначимо простір вибірки іA іB є двома подіями в S. Потім: (1)0 \leq P(\text{A}) \leq 1, (2) Якщо\text{A} і\text{B} є будь-якими двома взаємовиключними подіями, то\text{P}(\text{A OR B}) = P(\text{A}) + P(\text{B}) і (3)P(\text{S}) = 1. | OpenStax | |||
Функція розподілу ймовірностей (PDF) | математичний опис дискретної випадкової величини (RV), наведеного або у вигляді рівняння (формули), або у вигляді таблиці з перерахуванням всіх можливих результатів експерименту і ймовірності, пов'язаної з кожним результатом. | OpenStax | |||
Пропорція | кількість успіхів, поділене на загальну кількість у вибірці | OpenStax | |||
Якісні дані | Див. Дані. | OpenStax | |||
Кількісні дані | Див. Дані. | OpenStax | |||
Випадкове призначення | акт організації експериментальних одиниць в лікувальні групи з використанням випадкових методів | OpenStax | |||
Випадкова вибірка | метод вибору вибірки, яка дає кожному члену населення рівні шанси бути відібраними. | OpenStax | |||
Випадкова величина (RV) | характеристика інтересу до досліджуваної сукупності; загальним позначенням для змінних є великі латинські літериX, Y, Z,...; загальні позначення для конкретного значення з області (набір всіх можливих значень змінної) - латинські літери нижнього регіструxy, іz. Наприклад, якщоX кількість дітей в сім'ї, тоx являє собою конкретне ціле число 0, 1, 2, 3,... Змінні в статистиці відрізняються від змінних в проміжній алгебрі двома наступними способами. (1) Домен випадкової величини (RV) не обов'язково є числовим набором; область може бути виражена словами; наприклад, якщо колірX = волосся, то область {чорний, блондин, сірий, зелений, помаранчевий}. (2) Ми можемо сказати, яке конкретне значенняxX приймає випадкова величина тільки після виконання експерименту. | OpenStax | |||
Відносна частота | відношення кількості разів значення даних, що виникають у множині всіх результатів, до кількості всіх результатів до загальної кількості результатів | OpenStax | |||
Представницький зразок | підмножина населення, яка має ті ж характеристики, що і популяції | OpenStax | |||
Змінна відповіді | залежна змінна в експерименті; значення, яке вимірюється для зміни в кінці експерименту | OpenStax | |||
Зразок | підмножина досліджуваної популяції | OpenStax | |||
Простір зразків | сукупність всіх можливих результатів експерименту | OpenStax | |||
Ухил вибірки | не всі члени населення однаково схильні до вибору | OpenStax | |||
Розподіл вибірки | Враховуючи прості випадкові вибірки розміруn з даної сукупності з виміряною характеристикою, такою як середнє, пропорційне або стандартне відхилення для кожної вибірки, розподіл ймовірностей всіх виміряних характеристик називається розподілом вибірки. | OpenStax | |||
Помилка вибірки | природна варіація, яка виникає в результаті вибору вибірки для представлення більшої популяції; ця варіація зменшується зі збільшенням розміру вибірки, тому відбір більших зразків зменшує похибку вибірки. | OpenStax | |||
Відбір проб з заміною | Після того, як член населення обраний для включення до вибірки, цей член повертається до населення для відбору наступної особи. | OpenStax | |||
Відбір проб без заміни | Член населення може бути обраний для включення в вибірку тільки один раз. Якщо вибрано, учасник не повертається населенню до наступного відбору. | OpenStax | |||
Проста випадкова вибірка | простий метод вибору випадкової вибірки; дати кожному члену населення число. Використовуйте генератор випадкових чисел для вибору набору міток. Ці випадково вибрані мітки ідентифікують членів вашого зразка. | OpenStax | |||
Перекосений | використовується для опису даних, які не є симетричними; коли права частина графіка виглядає «відрізаною» порівняно з лівою стороною, ми говоримо, що вона «перекошена вліво». Коли ліва частина графіка виглядає «відрізаною» порівняно з правою стороною, ми говоримо, що дані «перекошені вправо». Альтернативно: коли нижчі значення даних більш поширені, ми говоримо, що дані перекошені вліво. Коли більші значення більш поширені, дані перекошуються вправо. | OpenStax | |||
Стандартне відхилення | число, яке дорівнює квадратному кореню дисперсії і вимірює, наскільки далекі значення даних від їх середнього; позначення: s для стандартного відхилення вибірки і σ для стандартного відхилення населення. | OpenStax | |||
Стандартне відхилення розподілу ймовірностей | число, яке вимірює, наскільки далеко результати статистичного експерименту знаходяться від середнього рівня розподілу | OpenStax | |||
Стандартна похибка середнього значення | стандартне відхилення розподілу зразка кошти, або\dfrac{\sigma}{\sqrt{n}}. | OpenStax | |||
Стандартний нормальний розподіл | неперервна випадкова величина (RV)X \sim N(0, 1); колиX слідує за стандартним нормальним розподілом, вона часто відзначається як\ (Z\ sim N (0, 1)\. | OpenStax | |||
Статистика | числова характеристика вибірки; статистика оцінює відповідний параметр популяції. | OpenStax | |||
Стратифікований відбір проб | метод відбору випадкової вибірки, що використовується для забезпечення адекватного представлення підгруп населення; поділу населення на групи (шари). Використовуйте просту випадкову вибірку, щоб визначити пропорційну кількість осіб з кожного шару. | OpenStax | |||
Студентський т -дистрибутив | досліджував і повідомив Вільям С. Госсетт в 1908 році і опублікований під псевдонімом Студент. Основними характеристиками випадкової величини (RV) є: (1) Вона є безперервною і передбачає будь-які реальні значення. (2) PDF симетричний щодо середнього нуля. Однак він більш розкинутий і плоский на вершині, ніж нормальний розподіл. (3) Він наближається до стандартного нормального розподілу, оскількиn стає більшим. (4) Існує «сім'я»t -розподілів: кожен представник сім'ї повністю визначається кількістю ступенів свободи що на одиницю менше, ніж кількість елементів даних. | OpenStax | |||
Систематична вибірка | метод вибору випадкової вибірки; перерахувати членів населення. Використовуйте просту випадкову вибірку, щоб вибрати початкову точку в популяції. Нехай k = (кількість особин в популяції)/(Кількість особин, необхідних в вибірці). Виберіть кожного kth індивіда у списку, починаючи з тієї, яка була вибрана випадковим чином. При необхідності поверніться до початку списку населення, щоб заповнити свій зразок. | OpenStax | |||
Подія «І» | Результат є в тому випадку,\text{A AND B} якщо результат в обох\text{A AND B} одночасно. | OpenStax | |||
Актуальна подія | Доповнення події\text{A} складається з усіх результатів, які НЕ знаходяться в\text{A}. | OpenStax | |||
Умовна імовірність A ЗАДАНОГО B | P(\text{A|B})ймовірність того, що подія\text{A} відбудеться з огляду на те, що подія\text{B} вже відбулася. | OpenStax | |||
Умовна ймовірність однієї події, заданої іншою подією | P (A | B) - ймовірність того, що подія A відбудеться, враховуючи, що подія B вже відбулася. | OpenStax | |||
Закон великих чисел | Зі збільшенням кількості випробувань в експерименті з ймовірністю різниця між теоретичною ймовірністю події та відносною ймовірністю частоти наближається до нуля. | OpenStax | |||
Подія або | Результат є в тому випадку,\text{A OR B} якщо результат знаходиться в\text{A} або знаходиться в\text{B} або є в обох\text{A} і\text{B}. | OpenStax | |||
АБО двох подій | Результат - у випадку A АБО B, якщо результат знаходиться в A, знаходиться в B або в обох A і B. | OpenStax | |||
лікування | різні значення або компоненти пояснювальної змінної, застосованої в експерименті | OpenStax | |||
Діаграма дерева | корисне візуальне представлення простору вибірки та подій у вигляді «дерева» з гілками, позначеними можливими наслідками разом з пов'язаними з ними ймовірностями (частоти, відносні частоти) | OpenStax | |||
Помилка типу 1 | Рішення полягає в тому, щоб відхилити нульову гіпотезу, коли насправді нульова гіпотеза вірна. | OpenStax | |||
Помилка типу 2 | Рішення полягає в тому, щоб не відкидати нульову гіпотезу, коли насправді нульова гіпотеза є помилковою. | OpenStax | |||
Рівномірний розподіл | безперервна випадкова величина (RV), яка має однаково ймовірні результати над доменомa < x < b; її часто називають прямокутним розподілом, оскільки графік PDF має форму прямокутника. Позначення:X \sim U(a,b). Середнє значення є\mu = \frac{a+b}{2} і стандартне відхилення є\sigma = \sqrt{\frac{(b-a)^{2}}{12}}. Функція щільності ймовірності -f(x) = \frac{1}{b-a} fora < x < b ora \leq x \leq b. Сукупний розподіл єP(X \leq x) = \frac{x-a}{b-a}. | OpenStax | |||
Рівномірний розподіл | безперервна випадкова величина (RV), яка має однаково ймовірні результати над доменом\(a < x < b\); часто називають прямокутним розподілом, оскільки графік PDF-файлу має форму прямокутника. Позначення:X \sim U(a, b). Середнє значення є\mu = \dfrac{a+b}{2} і стандартне відхилення є\sigma = \sqrt{\dfrac{(b-a)^{2}}{12}}. Функція щільності ймовірності -f(x) = \dfrac{a+b}{2} fora < x < b ora \leq x \leq b. Сукупний розподіл єP(X \leq x) = \dfrac{x-a}{b-a}. | OpenStax | |||
Змінна | характеристика інтересу для кожної людини або об'єкта в популяції | OpenStax | |||
Variable (випадкова величина) | характеристика інтересу до досліджуваного населення. Загальні позначення для змінних - це великі латинські літериX, Y, Z,... Загальними позначеннями для конкретного значення з області (набір всіх можливих значень змінної) є малі латинські літериx, y, z,... Наприклад, якщоX кількість дітей в сім'ї, тоx являє собою конкретне ціле число 0, 1, 2, 3,... Змінні в статистиці відрізняються від змінних в проміжній алгебрі двома наступними способами. (1) Домен випадкової величини (RV) не обов'язково є числовим набором; область може бути виражена словами; наприклад, якщо колірX = волосся, то доменом є {чорний, блондин, сірий, зелений, помаранчевий}. (2) Ми можемо сказати, яке конкретне значення x випадкової величиниX приймає тільки після виконання експерименту. | OpenStax | |||
дисперсія | середнє квадрат відхилень від середнього; квадрат стандартного відхилення. Для набору даних відхилення може бути представлено якx - \bar{x} де значення даних іx\bar{x} є вибірковим середнім. Дисперсія вибірки дорівнює сумі квадратів відхилень, поділеної на різницю розмірів вибірки і одиниці. | OpenStax | |||
Діаграма Венна | візуальне представлення зразка простору і подій у вигляді кіл або овалів, що показують їх перетину | OpenStax | |||
z-оцінка | лінійне перетворення формиz = \dfrac{x-\mu}{\sigma}; якщо це перетворення застосовується до будь-якого нормального розподілу, результатомX \sim N(\mu, \sigma є стандартний нормальний розподілZ \sim N(0,1). Якщо це перетворення застосовується до будь-якого конкретногоx значення RV із середнім\mu і стандартним відхиленням\sigma, результат називаєтьсяz -score ofx. z-score дозволяє нам порівнювати дані, які зазвичай розподіляються, але масштабуються по-різному. | OpenStax |