Глосарій
- Page ID
- 98497
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)
Слова (або слова, які мають однакове визначення) | Визначення чутливе до регістру | (Додатково) Зображення для відображення з визначенням [Не відображається в глосарії, лише у спливаючому вікні на сторінках] | (Додатково) Підпис для зображення | (Необов'язково) Зовнішнє або внутрішнє посилання | (Необов'язково) Джерело для визначення |
---|---|---|---|---|---|
(Наприклад. «Генетичні, спадкові, ДНК...») | (Наприклад. «Відноситься до генів або спадковості») | Сумнозвісна подвійна спіраль | https://bio.libretexts.org/ | CC-BY-SA; Дельмар Ларсен |
Аналіз Вардельмара
Слово (и) | Визначення | Зображення | Підпис | Посилання | Джерело |
---|---|---|---|---|---|
Аналіз дисперсії, аналіз Вардельмара | також називають ANOVA, це метод тестування, чи рівні засоби трьох або більше популяцій. Метод застосовується, якщо: (1) всі зацікавлені популяції зазвичай розподілені. (2) популяції мають однакові стандартні відхилення. (3) зразки (не обов'язково однакового розміру) вибираються випадковим чином і незалежно від кожної популяції. (4) Тестова статистика для аналізу дисперсії - це\(F\) -співвідношення. | OpenStax | |||
Середній | число, яке описує центральну тенденцію даних; існує ряд спеціалізованих середніх, включаючи середнє арифметичне, середньозважене, медіану, моду та середнє геометричне. | OpenStax | |||
Випробування Бернуллі | експеримент з наступними характеристиками: (1) Є лише два можливі результати, які називаються «успіх» та «невдача» для кожного випробування. (2)\(p\) Імовірність успіху однакова для будь-якого випробування (тому ймовірність\(q = 1 − p\) невдачі однакова для будь-якого судового розгляду). | OpenStax | |||
Біноміальний розподіл | дискретна випадкова величина (RV), яка виникає в результаті випробувань Бернуллі. Є фіксована кількість\(n\), незалежних випробувань. «Незалежний» означає, що результат будь-якого судового розгляду (наприклад, судового розгляду 1) не впливає на результати наступних випробувань, і всі випробування проводяться в однакових умовах. За цих обставин біноміальний RV визначається як кількість успіхів у\(n\) випробуваннях. Позначення таке:\(X \sim B(n, p) \mu = np\) а стандартне відхилення є\(\sigma = \sqrt{npq}\). Імовірність точно\(x\) успіхів у\(n\) випробуваннях є\(P(X = x) = \binom{n}{x} p^{x}q^{n-x}\). | OpenStax | |||
Біноміальний експеримент | статистичний експеримент, який задовольняє наступним трьом умовам: (1) Існує фіксована кількість випробувань\(n\). (2) Є лише два можливі результати, які називаються «успіх» та «невдача» для кожного випробування. Буква\(p\) позначає ймовірність успіху на одному випробуванні, і\(q\) позначає ймовірність невдачі на одному\(n\) випробуванні. (3) Випробування незалежні і повторюються з використанням однакових умов. | OpenStax | |||
Біноміальний розподіл ймовірностей | дискретна випадкова величина (RV), яка виникає з випробувань Бернуллі; є фіксоване число\(n\), незалежних випробувань. «Незалежний» означає, що результат будь-якого судового розгляду (наприклад, пробного) не впливає на результати наступних випробувань, і всі судові розгляди проводяться в однакових умовах. За цих обставин біноміальний RV\(X\) визначається як кількість успіхів у\(n\) випробуваннях. Позначення це:\(X ~ B(n, p)\). Середнє значення є\(\mu = np\) і стандартне відхилення є\(\sigma = \sqrt{npq}\). Імовірність точно\(x\) успіхів у\(n\) випробуваннях є\(P(X = x) = {n \choose x}p^{x}q^{n-x}\). | OpenStax | |||
осліплення | не повідомляючи учасникам, яке лікування отримує суб'єкт | OpenStax | |||
Коробка сюжету | графік, який дає швидке уявлення про середні 50% даних | OpenStax | |||
Категорична змінна | змінні, які приймають значення, які є іменами або мітками | OpenStax | |||
Центральна гранична теорема | Враховуючи випадкову величину (RV) з відомим середнім\(\mu\) і відомим стандартним відхиленням\(\sigma\)\(n\), ми проводимо вибірку з розміром, і нас цікавлять два нових RV: середнє значення вибірки та сума вибірки\(\sum X\).\(\bar{X}\) Якщо розмір (\(n\)) зразка досить великий, то\(\bar{X} \sim N\left(\mu, \dfrac{\sigma}{\sqrt{n}}\right)\) і\(\sum X \sim N(n\mu, (\sqrt{n})(\sigma))\). Якщо розмір (\(n\)) вибірки досить великий, то розподіл засобів вибірки і розподіл сум вибірки будуть наближатися до нормальних розподілів незалежно від форми сукупності. Середнє значення вибіркових засобів дорівнюватиме середньому чисельності населення, а середнє значення сум вибірки\(n\) дорівнюватиме середньому населенню. Стандартне відхилення розподілу засобів вибірки\(\dfrac{\sigma}{\sqrt{n}}\), називається стандартною похибкою середнього. | OpenStax | |||
Центральна гранична теорема | Дано випадкову величину (RV) з відомим середнім\(\mu\) і відомим стандартним відхиленням\(\sigma\). Ми проводимо вибірку з розміром\(n\) і нас цікавлять два нових RV - середнє значення вибірки\(\bar{X}\), і сума вибірки,\(\sum X\). Якщо розмір\(n\) зразка досить великий, то\(\bar{X} - N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\) і\(\sum X - N \left(n\mu, \sqrt{n}\sigma\right)\). Якщо розмір n вибірки досить великий, то розподіл засобів вибірки і розподіл сум вибірки будуть наближатися до нормального розподілу незалежно від форми сукупності. Середнє значення вибіркових засобів дорівнюватиме середньому населенню, а середнє значення сум вибірки\(n\) дорівнюватиме середньому населенню. Стандартне відхилення розподілу засобів вибірки\(\frac{\sigma}{\sqrt{n}}\), називається стандартною похибкою середнього. | OpenStax | |||
Кластерна вибірка | метод вибору випадкової вибірки і поділу популяції на групи (кластери); використовувати просту випадкову вибірку для вибору набору кластерів. Кожна людина в обраних кластерах включається до вибірки. | OpenStax | |||
коефіцієнт кореляції | міра, розроблена Карлом Пірсоном (початок 1900-х), яка дає силу зв'язку між незалежною змінною та залежною змінною; формула:\[r = \dfrac{n \sum xy - \left(\sum x\right) \left(\sum y\right)}{\sqrt{\left[n \sum x^{2} - \left(\sum x\right)^{2}\right] \left[n \sum y^{2} - \left(\sum y\right)^{2}\right]}}\] де\(n\) кількість точок даних. Коефіцієнт не може бути більше 1 або менше —1. Чим ближче коефіцієнт до ± 1, тим сильніше свідчать про значну лінійну залежність між\(x\) і\(y\). | OpenStax | |||
Умовна ймовірність | ймовірність того, що подія відбудеться з огляду на те, що інша подія вже сталася | OpenStax | |||
Довірчий інтервал (CI) | інтервальна оцінка для невідомого параметра популяції. Це залежить від: (1) бажаного рівня довіри. (2) Відомості про розподіл (наприклад, відоме стандартне відхилення). (3) Вибірка та його розмір. | OpenStax | |||
Рівень довіри (CL) | процентний вираз для ймовірності того, що довірчий інтервал містить істинний параметр популяції; наприклад, якщо\(CL = 90%\), то в 90 з 100 вибірок інтервальну оцінку буде укладати істинний параметр популяції. | OpenStax | |||
таблиця надзвичайних ситуацій | метод відображення частотного розподілу у вигляді таблиці з рядками і стовпцями, щоб показати, як дві змінні можуть бути залежними (залежними) один від одного; таблиця надає простий спосіб обчислення умовних ймовірностей. | OpenStax | |||
Безперервна випадкова величина | випадкова величина (RV), результати якої вимірюються; висота дерев у лісі є безперервним RV. | OpenStax | |||
Контрольна група | група в рандомізованому експерименті, яка отримує неактивне лікування, але в іншому випадку управляється точно так само, як і інші групи | OpenStax | |||
Зручність вибірки | невипадковий метод відбору вибірки; цей метод відбирає осіб, які легко доступні і можуть призвести до упереджених даних. | OpenStax | |||
Накопичувальна відносна частота | Термін застосовується до впорядкованого набору спостережень від найменшого до найбільшого. Сукупна відносна частота - це сума відносних частот для всіх значень, які менше або рівні заданому значенню. | OpenStax | |||
Дані | сукупність спостережень (сукупність можливих результатів); більшість даних можна помістити в дві групи: якісні (атрибут, значення якого позначається міткою) або кількісні (атрибут, значення якого позначається числом). Кількісні дані можна розділити на дві підгрупи: дискретні і неперервні. Дані дискретні, якщо це результат підрахунку (наприклад, кількість учнів даної етнічної групи в класі або кількість книг на полиці). Дані є безперервними, якщо це результат вимірювання (наприклад, пройдена відстань або вага багажу) | OpenStax | |||
параметр розпаду | Параметр розпаду описує швидкість, з якою ймовірності падають до нуля для збільшення значень\(x\). Це значення\(m\) в функції\(f(x) = me^{(-mx)}\) щільності ймовірності експоненціальної випадкової величини. Вона також дорівнює тому\(m = \dfrac{1}{\mu}\), де\(\mu\) знаходиться середнє значення випадкової величини. | OpenStax | |||
Ступені свободи (df) | кількість об'єктів у зразку, які вільно варіюються. | OpenStax | |||
Залежні події | Якщо дві події НЕ є незалежними, то ми говоримо, що вони залежні. | OpenStax | |||
Дискретна випадкова величина | випадкова величина (RV), результати якої підраховуються | OpenStax | |||
Подвійне сліпуче | акт засліплення як суб'єктів експерименту, так і дослідників, які працюють з суб'єктами | OpenStax | |||
Однаково ймовірно | Кожен результат експерименту має однакову ймовірність. | OpenStax | |||
Помилка прив'язана до середнього значення популяції (EBM) | похибка; залежить від рівня довіри, розміру вибірки та відомого або передбачуваного стандартного відхилення населення. | OpenStax | |||
Помилка прив'язана до пропорції населення (EBP) | похибка; залежить від рівня довіри, розміру вибірки та оцінюваної (від вибірки) частки успіхів. | OpenStax | |||
Подія | підмножина множини всіх результатів експерименту; множина всіх результатів експерименту називається простором вибірки і зазвичай позначається символом\(S\). Подія є довільною підмножиною в\(S\). Він може містити один результат, два результати, відсутність результатів (порожня підмножина), весь простір вибірки тощо. Стандартними позначеннями для подій є великі літери типу\(A, B, C\), і так далі. | OpenStax | |||
Очікувана вартість | очікуване середнє арифметичне, коли експеримент повторюється багато разів; також називається середнім. Позначення:\(\mu\). Для дискретної випадкової величини (RV) з функцією\(P(x)\) розподілу ймовірностей визначення також може бути записано у вигляді\(\mu = \sum{xP(x)}\). | OpenStax | |||
Експеримент | планова діяльність, що здійснюється в контрольованих умовах | OpenStax | |||
Експериментальна одиниця | будь-яка фізична особа або об'єкт, що підлягає вимірюванню | OpenStax | |||
Пояснювальна змінна | незалежна змінна в експерименті; значення, контрольоване дослідниками | OpenStax | |||
Експоненціальний розподіл | безперервна випадкова величина (RV), яка з'являється, коли ми зацікавлені в інтервалах часу між деякими випадковими подіями, наприклад, тривалість часу між надзвичайними прибуття в лікарню; позначення є\(X \sim \text{Exp}(m)\). Середнє значення є\(\mu = \frac{1}{m}\) і стандартне відхилення є\(\sigma = \frac{1}{m}\). Функція щільності ймовірності є\(f(x) = me^{-mx}\),\(x \geq 0\) а функція кумулятивного розподілу -\(P(X \leq x) = 1 − e^{mx}\). | OpenStax | |||
Перший квартиль | значення, яке є медіаною нижньої половини впорядкованого набору даних | OpenStax | |||
Частота | кількість разів виникає значення даних | OpenStax | |||
Багатокутник частоти | виглядає як лінійний графік, але використовує інтервали для відображення діапазонів великих обсягів даних | OpenStax | |||
Таблиця частот | представлення даних, в якому згруповані дані відображаються разом з відповідними частотами | OpenStax | |||
Геометричний розподіл | дискретна випадкова величина (RV), яка виникає в результаті випробувань Бернуллі; випробування повторюються до першого успіху. \(X\)Геометрична змінна визначається як кількість випробувань до першого успіху. Позначення:\(X \sim G(p)\). Середнє значення є\(\mu = \dfrac{1}{p}\) і стандартне відхилення є\(\sigma = \sqrt{\dfrac{1}{p}\left(\dfrac{1}{p} - 1\right)}\). Імовірність саме\(x\) невдач перед першим успіхом задається формулою:\(P(X = x) = p(1 –p)^{x-1}\). | OpenStax | |||
Геометричний експеримент | статистичний експеримент з наступними властивостями: (1) Є одне або кілька випробувань Бернуллі з усіма невдачами, крім останнього, який є успішним. (2) Теоретично кількість випробувань може тривати назавжди. Має бути принаймні одне випробування. (3) Імовірність успіху та ймовірності невдачі не\(q\) змінюються від судового розгляду до судового розгляду\(p\) | OpenStax | |||
Гіпергеометричний експеримент | статистичний експеримент з наступними властивостями: (1) Ви берете зразки з двох груп. (2) Вас цікавить група, яка називається першою групою. (3) Ви вибірку без заміни з комбінованих груп. (4) Кожен вибір не є незалежним, оскільки вибірка проводиться без заміни. (5) Ви не має справу з випробуваннями Бернуллі. | OpenStax | |||
Гіпергеометрична ймовірність | дискретна випадкова величина (RV), яка характеризується: (1) фіксованою кількістю випробувань. (2) Імовірність успіху не однакова від випробування до судового розгляду. Ми вибірки з двох груп предметів, коли нас цікавить лише одна група. \(X\)визначається як кількість успіхів із загальної кількості обраних предметів. \(r =\)Позначення:\(X \sim H(r, b, n)\), де кількість позицій в групі цікавить,\(b =\) кількість елементів в групі не цікавить, і\(n =\) кількість обраних елементів. | OpenStax | |||
гіпотеза | твердження про значення параметра популяції, в разі двох гіпотез твердження, яке вважається істинним, називається нульовою гіпотезою (нотацією\(H_{0}\)) і суперечливе твердження називається альтернативною гіпотезою (нотацією\(H_{a}\)). | OpenStax | |||
Тестування гіпотез | Виходячи з зразкових доказів, процедура визначення того, чи є викладена гіпотеза розумним твердженням і не повинна бути відхилена, або є необґрунтованою і повинна бути відхилена. | OpenStax | |||
Незалежні заходи | Виникнення однієї події ніяк не впливає на ймовірність виникнення іншої події. Події\(\text{A}\) і\(\text{B}\) є незалежними, якщо виконується одне з наведених нижче пунктів: (1)\(P(\text{A|B}) = P(\text{A})\), (2)\(P(\text{B|A}) = P(\text{B})\), (3)\(P(\text{A AND B}) = P(\text{A})P(\text{B})\) | OpenStax | |||
Статистика висновків | також називається статистичним висновком або індуктивною статистикою; ця грань статистики стосується оцінки параметра популяції на основі вибіркової статистики. Наприклад, якщо чотири з 100 вибіркових калькуляторів несправні, ми можемо зробити висновок, що чотири відсотки виробництва є дефектними. | OpenStax | |||
Інформована згода | Будь-який суб'єкт людини в дослідницькому дослідженні повинен усвідомлювати будь-які ризики або витрати, пов'язані з дослідженням. Суб'єкт має право знати характер процедур, включених у дослідження, їх потенційні ризики та їх потенційні переваги. Згода повинна надаватися вільно інформованим, придатним учасником. | OpenStax | |||
Інституційна оглядова рада | комітет, якому доручено здійснювати контроль за дослідницькими програмами, які стосуються людських суб'єктів | OpenStax | |||
Інтервал | також називається інтервалом класів; інтервал представляє діапазон даних і використовується при відображенні великих наборів даних | OpenStax | |||
Рівень значущості тесту | ймовірність помилки I типу (відхилити нульову гіпотезу, коли вона істинна). Позначення:\(\alpha\). У тестуванні гіпотез Рівень значущості називається упередженим\(\alpha\) або попередньо встановленим\(\alpha\). | OpenStax | |||
Змінна ховається | змінна, яка впливає на дослідження, хоча це ні пояснювальна змінна, ні змінна відповідь | OpenStax | |||
Середнє | число, яке вимірює центральну тенденцію; загальною назвою для середнього є «середній». Термін «середнє» - це скорочена форма «середнє арифметичне». За визначенням, середнє значення для вибірки (позначається\(\bar{x}\)) є\(\bar{x} = \dfrac{\text{Sum of all values in the sample}}{\text{Number of values in the sample}}\), а середнє для популяції (позначається\(\mu\)) -\(\mu = \dfrac{\text{Sum of all values in the population}}{\text{Number of values in the population}}\). | OpenStax | |||
Середнє значення розподілу ймовірностей | довгострокове середнє значення багатьох випробувань статистичного експерименту | OpenStax | |||
Медіана | число, яке розділяє впорядковані дані навпіл; половина значень - це те саме число або менше медіани, а половина значень - те саме число або більше медіани. Медіана може бути частиною даних, а може і не бути. | OpenStax | |||
майно, що не запам'ятовується | Для експоненціальної випадкової\(X\) величини властивість memoryless - це твердження про те, що знання того, що сталося в минулому, не впливає на майбутні ймовірності. Це означає, що ймовірність, яка\(X\) перевищує\(x + k\), враховуючи, що вона перевищила\(x\), така ж, як і ймовірність, яка перевищила\(X\) б,\(k\) якби ми не мали про це знань. У символах ми говоримо, що\(P(X > x + k | X > x) = P(X > k)\) | OpenStax | |||
Середина | середнє значення інтервалу в таблиці частот | OpenStax | |||
Режим | значення, яке найчастіше з'являється в наборі даних | OpenStax | |||
Взаємовиключні | Дві події є взаємовиключними, якщо ймовірність того, що вони обидва відбуваються одночасно, дорівнює нулю. Якщо події\(\text{A}\) і\(\text{B}\) є взаємовиключними, то\(P(\text{A AND B}) = 0\). | OpenStax | |||
Помилка без дискретизації | проблема, яка впливає на надійність даних вибірки, крім природних змін; вона включає різні людські помилки, включаючи поганий дизайн дослідження, упереджені методи вибірки, неточну інформацію, надану учасниками дослідження, помилки введення даних та поганий аналіз. | OpenStax | |||
Нормальний розподіл | безперервна випадкова величина (RV) з pdf\(f(x) = \dfrac{1}{\sigma \sqrt{2 \pi}}e^{\dfrac{-(x-\mu)^{2}}{2 \sigma^{2}}}\), де\(\mu\) середнє значення розподілу і\(\sigma\) є стандартним відхиленням; позначення:\(X \sim N(\mu, \sigma)\). Якщо\(\mu = 0\) і\(\sigma = 1\), то РВ називається стандартним нормальним розподілом. | OpenStax | |||
Чисельна змінна | змінні, які приймають значення, які позначаються числами | OpenStax | |||
Одностороння ANOVA | метод перевірки того, чи рівні засоби трьох або більше популяцій; метод застосовується, якщо: (1) всі зацікавлені популяції зазвичай розподілені. (2) популяції мають рівні стандартні відхилення. (3) зразки (не обов'язково однакового розміру) вибираються випадковим чином і незалежно від кожної популяції. (4) Тестова статистика для аналізу дисперсії - це\(F\) коефіцієнт. | OpenStax | |||
Результат | конкретний результат експерименту | OpenStax | |||
викиди | спостереження, яке не відповідає решті даних | OpenStax | |||
p-значення | ймовірність того, що подія відбудеться чисто випадково, припускаючи, що нульова гіпотеза вірна. Чим менше\(p\) -значення, тим сильніше докази проти нульової гіпотези. | OpenStax | |||
Парний набір даних | два набори даних, які мають відношення один до одного, так що: (1) обидва набори даних мають однаковий розмір, і (2) кожна точка даних в одному наборі даних збігається з точно однією точкою з іншого набору. | OpenStax | |||
Параметр | число, яке використовується для представлення характеристики популяції і які, як правило, не можуть бути визначені легко | OpenStax | |||
Параметр | числова характеристика популяції | OpenStax | |||
Плацебо | неактивне лікування, яке не має реального впливу на пояснювальну змінну | OpenStax | |||
Оцінка точки | єдине число, обчислене з вибірки і використовується для оцінки параметра популяції | OpenStax | |||
розподіл Пуассона | Якщо є відоме середнє значення\(\lambda\) подій, що відбуваються в одиницю часу, і ці події незалежні один від одного, то кількість подій,\(X\) що відбуваються в одній одиниці часу, має розподіл Пуассона. Імовірність k подій, що відбуваються за одну одиницю часу, дорівнює\(P(X = k) = \dfrac{\lambda^{k}e^{-\lambda}}{k!}\). | OpenStax | |||
Розподіл ймовірностей Пуассона | дискретна випадкова величина (RV), яка підраховує кількість разів, коли певна подія відбудеться в певному інтервалі; характеристики змінної: (1) Імовірність того, що подія відбувається в заданому інтервалі однакова для всіх інтервалів. (2) Події відбуваються з відомим середнім і незалежно від часу з моменту останньої події. Розподіл визначається середнім\(\mu\) значенням події в інтервалі. Позначення:\(X \sim P(\mu)\). Середнє значення є\(\mu = np\). Стандартне відхилення - це\(\sigma = \sqrt{\mu}\). Імовірність того, що точно\(x\) успіхи у\(r\) випробуваннях є\(P(X = x) = \left(e^{-\mu}\right)\frac{\mu^{x}}{x!}\). Розподіл Пуассона часто використовується для наближення біноміального розподілу, коли\(n\) є «великим» і\(p\) «малим» (загальне правило полягає в тому, що\(n\) повинно бути більше або дорівнює 20 і\(p\) повинно бути менше або дорівнює 0,05). | OpenStax | |||
Об'єднана пропорція | оцінка загальної вартості\(p_{1}\) і\(p_{2}\). | OpenStax | |||
Населення | всі особи, об'єкти або вимірювання, властивості яких вивчаються | OpenStax | |||
Імовірність | число між нулем і одиницею включно, що дає ймовірність того, що відбудеться конкретна подія | OpenStax | |||
Імовірність | число між нулем і одиницею, включно, що дає ймовірність того, що відбудеться конкретна подія; основу статистики дають наступні 3 аксіоми (А.Н.Колмогорова, 1930-е рр.): Давайте\(S\) позначимо простір вибірки і\(A\) і\(B\) є двома подіями в S. Потім: (1)\(0 \leq P(\text{A}) \leq 1\), (2) Якщо\(\text{A}\) і\(\text{B}\) є будь-якими двома взаємовиключними подіями, то\(\text{P}(\text{A OR B}) = P(\text{A}) + P(\text{B})\) і (3)\(P(\text{S}) = 1\). | OpenStax | |||
Функція розподілу ймовірностей (PDF) | математичний опис дискретної випадкової величини (RV), наведеного або у вигляді рівняння (формули), або у вигляді таблиці з перерахуванням всіх можливих результатів експерименту і ймовірності, пов'язаної з кожним результатом. | OpenStax | |||
Пропорція | кількість успіхів, поділене на загальну кількість у вибірці | OpenStax | |||
Якісні дані | Див. Дані. | OpenStax | |||
Кількісні дані | Див. Дані. | OpenStax | |||
Випадкове призначення | акт організації експериментальних одиниць в лікувальні групи з використанням випадкових методів | OpenStax | |||
Випадкова вибірка | метод вибору вибірки, яка дає кожному члену населення рівні шанси бути відібраними. | OpenStax | |||
Випадкова величина (RV) | характеристика інтересу до досліджуваної сукупності; загальним позначенням для змінних є великі латинські літери\(X, Y, Z\),...; загальні позначення для конкретного значення з області (набір всіх можливих значень змінної) - латинські літери нижнього регістру\(x\)\(y\), і\(z\). Наприклад, якщо\(X\) кількість дітей в сім'ї, то\(x\) являє собою конкретне ціле число 0, 1, 2, 3,... Змінні в статистиці відрізняються від змінних в проміжній алгебрі двома наступними способами. (1) Домен випадкової величини (RV) не обов'язково є числовим набором; область може бути виражена словами; наприклад, якщо колір\(X =\) волосся, то область {чорний, блондин, сірий, зелений, помаранчевий}. (2) Ми можемо сказати, яке конкретне значення\(x\)\(X\) приймає випадкова величина тільки після виконання експерименту. | OpenStax | |||
Відносна частота | відношення кількості разів значення даних, що виникають у множині всіх результатів, до кількості всіх результатів до загальної кількості результатів | OpenStax | |||
Представницький зразок | підмножина населення, яка має ті ж характеристики, що і популяції | OpenStax | |||
Змінна відповіді | залежна змінна в експерименті; значення, яке вимірюється для зміни в кінці експерименту | OpenStax | |||
Зразок | підмножина досліджуваної популяції | OpenStax | |||
Простір зразків | сукупність всіх можливих результатів експерименту | OpenStax | |||
Ухил вибірки | не всі члени населення однаково схильні до вибору | OpenStax | |||
Розподіл вибірки | Враховуючи прості випадкові вибірки розміру\(n\) з даної сукупності з виміряною характеристикою, такою як середнє, пропорційне або стандартне відхилення для кожної вибірки, розподіл ймовірностей всіх виміряних характеристик називається розподілом вибірки. | OpenStax | |||
Помилка вибірки | природна варіація, яка виникає в результаті вибору вибірки для представлення більшої популяції; ця варіація зменшується зі збільшенням розміру вибірки, тому відбір більших зразків зменшує похибку вибірки. | OpenStax | |||
Відбір проб з заміною | Після того, як член населення обраний для включення до вибірки, цей член повертається до населення для відбору наступної особи. | OpenStax | |||
Відбір проб без заміни | Член населення може бути обраний для включення в вибірку тільки один раз. Якщо вибрано, учасник не повертається населенню до наступного відбору. | OpenStax | |||
Проста випадкова вибірка | простий метод вибору випадкової вибірки; дати кожному члену населення число. Використовуйте генератор випадкових чисел для вибору набору міток. Ці випадково вибрані мітки ідентифікують членів вашого зразка. | OpenStax | |||
Перекосений | використовується для опису даних, які не є симетричними; коли права частина графіка виглядає «відрізаною» порівняно з лівою стороною, ми говоримо, що вона «перекошена вліво». Коли ліва частина графіка виглядає «відрізаною» порівняно з правою стороною, ми говоримо, що дані «перекошені вправо». Альтернативно: коли нижчі значення даних більш поширені, ми говоримо, що дані перекошені вліво. Коли більші значення більш поширені, дані перекошуються вправо. | OpenStax | |||
Стандартне відхилення | число, яке дорівнює квадратному кореню дисперсії і вимірює, наскільки далекі значення даних від їх середнього; позначення: s для стандартного відхилення вибірки і σ для стандартного відхилення населення. | OpenStax | |||
Стандартне відхилення розподілу ймовірностей | число, яке вимірює, наскільки далеко результати статистичного експерименту знаходяться від середнього рівня розподілу | OpenStax | |||
Стандартна похибка середнього значення | стандартне відхилення розподілу зразка кошти, або\(\dfrac{\sigma}{\sqrt{n}}\). | OpenStax | |||
Стандартний нормальний розподіл | неперервна випадкова величина (RV)\(X \sim N(0, 1)\); коли\(X\) слідує за стандартним нормальним розподілом, вона часто відзначається як\ (Z\ sim N (0, 1)\. | OpenStax | |||
Статистика | числова характеристика вибірки; статистика оцінює відповідний параметр популяції. | OpenStax | |||
Стратифікований відбір проб | метод відбору випадкової вибірки, що використовується для забезпечення адекватного представлення підгруп населення; поділу населення на групи (шари). Використовуйте просту випадкову вибірку, щоб визначити пропорційну кількість осіб з кожного шару. | OpenStax | |||
Студентський т -дистрибутив | досліджував і повідомив Вільям С. Госсетт в 1908 році і опублікований під псевдонімом Студент. Основними характеристиками випадкової величини (RV) є: (1) Вона є безперервною і передбачає будь-які реальні значення. (2) PDF симетричний щодо середнього нуля. Однак він більш розкинутий і плоский на вершині, ніж нормальний розподіл. (3) Він наближається до стандартного нормального розподілу, оскільки\(n\) стає більшим. (4) Існує «сім'я»\(t\) -розподілів: кожен представник сім'ї повністю визначається кількістю ступенів свободи що на одиницю менше, ніж кількість елементів даних. | OpenStax | |||
Систематична вибірка | метод вибору випадкової вибірки; перерахувати членів населення. Використовуйте просту випадкову вибірку, щоб вибрати початкову точку в популяції. Нехай k = (кількість особин в популяції)/(Кількість особин, необхідних в вибірці). Виберіть кожного kth індивіда у списку, починаючи з тієї, яка була вибрана випадковим чином. При необхідності поверніться до початку списку населення, щоб заповнити свій зразок. | OpenStax | |||
Подія «І» | Результат є в тому випадку,\(\text{A AND B}\) якщо результат в обох\(\text{A AND B}\) одночасно. | OpenStax | |||
Актуальна подія | Доповнення події\(\text{A}\) складається з усіх результатів, які НЕ знаходяться в\(\text{A}\). | OpenStax | |||
Умовна імовірність A ЗАДАНОГО B | \(P(\text{A|B})\)ймовірність того, що подія\(\text{A}\) відбудеться з огляду на те, що подія\(\text{B}\) вже відбулася. | OpenStax | |||
Умовна ймовірність однієї події, заданої іншою подією | P (A | B) - ймовірність того, що подія A відбудеться, враховуючи, що подія B вже відбулася. | OpenStax | |||
Закон великих чисел | Зі збільшенням кількості випробувань в експерименті з ймовірністю різниця між теоретичною ймовірністю події та відносною ймовірністю частоти наближається до нуля. | OpenStax | |||
Подія або | Результат є в тому випадку,\(\text{A OR B}\) якщо результат знаходиться в\(\text{A}\) або знаходиться в\(\text{B}\) або є в обох\(\text{A}\) і\(\text{B}\). | OpenStax | |||
АБО двох подій | Результат - у випадку A АБО B, якщо результат знаходиться в A, знаходиться в B або в обох A і B. | OpenStax | |||
лікування | різні значення або компоненти пояснювальної змінної, застосованої в експерименті | OpenStax | |||
Діаграма дерева | корисне візуальне представлення простору вибірки та подій у вигляді «дерева» з гілками, позначеними можливими наслідками разом з пов'язаними з ними ймовірностями (частоти, відносні частоти) | OpenStax | |||
Помилка типу 1 | Рішення полягає в тому, щоб відхилити нульову гіпотезу, коли насправді нульова гіпотеза вірна. | OpenStax | |||
Помилка типу 2 | Рішення полягає в тому, щоб не відкидати нульову гіпотезу, коли насправді нульова гіпотеза є помилковою. | OpenStax | |||
Рівномірний розподіл | безперервна випадкова величина (RV), яка має однаково ймовірні результати над доменом\(a < x < b\); її часто називають прямокутним розподілом, оскільки графік PDF має форму прямокутника. Позначення:\(X \sim U(a,b)\). Середнє значення є\(\mu = \frac{a+b}{2}\) і стандартне відхилення є\(\sigma = \sqrt{\frac{(b-a)^{2}}{12}}\). Функція щільності ймовірності -\(f(x) = \frac{1}{b-a}\) for\(a < x < b\) or\(a \leq x \leq b\). Сукупний розподіл є\(P(X \leq x) = \frac{x-a}{b-a}\). | OpenStax | |||
Рівномірний розподіл | безперервна випадкова величина (RV), яка має однаково ймовірні результати над доменом\(a < x < b\); часто називають прямокутним розподілом, оскільки графік PDF-файлу має форму прямокутника. Позначення:\(X \sim U(a, b)\). Середнє значення є\(\mu = \dfrac{a+b}{2}\) і стандартне відхилення є\(\sigma = \sqrt{\dfrac{(b-a)^{2}}{12}}\). Функція щільності ймовірності -\(f(x) = \dfrac{a+b}{2}\) for\(a < x < b\) or\(a \leq x \leq b\). Сукупний розподіл є\(P(X \leq x) = \dfrac{x-a}{b-a}\). | OpenStax | |||
Змінна | характеристика інтересу для кожної людини або об'єкта в популяції | OpenStax | |||
Variable (випадкова величина) | характеристика інтересу до досліджуваного населення. Загальні позначення для змінних - це великі латинські літери\(X, Y, Z,\)... Загальними позначеннями для конкретного значення з області (набір всіх можливих значень змінної) є малі латинські літери\(x, y, z,\)... Наприклад, якщо\(X\) кількість дітей в сім'ї, то\(x\) являє собою конкретне ціле число 0, 1, 2, 3,... Змінні в статистиці відрізняються від змінних в проміжній алгебрі двома наступними способами. (1) Домен випадкової величини (RV) не обов'язково є числовим набором; область може бути виражена словами; наприклад, якщо колір\(X =\) волосся, то доменом є {чорний, блондин, сірий, зелений, помаранчевий}. (2) Ми можемо сказати, яке конкретне значення x випадкової величини\(X\) приймає тільки після виконання експерименту. | OpenStax | |||
дисперсія | середнє квадрат відхилень від середнього; квадрат стандартного відхилення. Для набору даних відхилення може бути представлено як\(x - \bar{x}\) де значення даних і\(x\)\(\bar{x}\) є вибірковим середнім. Дисперсія вибірки дорівнює сумі квадратів відхилень, поділеної на різницю розмірів вибірки і одиниці. | OpenStax | |||
Діаграма Венна | візуальне представлення зразка простору і подій у вигляді кіл або овалів, що показують їх перетину | OpenStax | |||
z-оцінка | лінійне перетворення форми\(z = \dfrac{x-\mu}{\sigma}\); якщо це перетворення застосовується до будь-якого нормального розподілу, результатом\(X \sim N(\mu, \sigma\) є стандартний нормальний розподіл\(Z \sim N(0,1)\). Якщо це перетворення застосовується до будь-якого конкретного\(x\) значення RV із середнім\(\mu\) і стандартним відхиленням\(\sigma\), результат називається\(z\) -score of\(x\). \(z\)-score дозволяє нам порівнювати дані, які зазвичай розподіляються, але масштабуються по-різному. | OpenStax |