Skip to main content
LibreTexts - Ukrayinska

1.1: Статистичні основи

  • Page ID
    65994
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Дані навколо нас. Дослідники збирають дані про ефективність медикаменту для зниження холестерину. Опитувальники повідомляють про відсоток американців, які підтримують контроль над зброєю. Економісти звітують про середню зарплату випускників коледжів. Є багато інших областей, де збираються дані. Для того щоб мати можливість розуміти дані і як їх узагальнити, нам потрібно розібратися в статистиці.

    Припустимо, ви хочете знати середню чисту вартість поточного сенатора США. Сенаторів 100, тому зібрати всі 100 значень не так вже й складно, а потім підсумувати дані. Якщо замість цього ви хочете знайти середню чисту вартість всіх нинішніх сенаторів та представників Конгресу США, є лише 435 членів Конгресу. Тож, незважаючи на те, що це буде трохи більше роботи, це не так складно знайти середню чисту вартість всіх членів. Тепер припустимо, ви хочете знайти середню чисту вартість всіх у Сполучених Штатах. Це було б дуже складно, якщо не неможливо. Це займе багато часу і грошей, щоб зібрати інформацію своєчасно, перш ніж всі цінності змінилися. Тому замість того, щоб отримати чистий капітал кожного американця, ми повинні з'ясувати більш простий спосіб знайти цю інформацію. Чиста вартість - це те, що ви хочете виміряти, і називається змінною. Чистий капітал кожного американця називається населенням. Що нам потрібно зробити, це зібрати меншу частину населення, яка називається вибіркою. Для того щоб побачити, як це працює, давайте формалізуємо визначення.

    Змінна: Будь-яка характеристика, яка вимірюється від об'єкта або індивіда.

    Популяція: Сукупність вимірювань або спостережень з усіх досліджуваних об'єктів
    Зразок: Сукупність вимірювань або спостережень з деяких досліджуваних об'єктів (підмножина популяції)

    Приклад\(\PageIndex{1}\): Заявка популяцій та зразків

    Визначте чисельність населення і вибірку для кожної ситуації.

    1. Дослідник хоче визначити довжину життєвого циклу короїда. Для того щоб це зробити, він розводить 1000 короїдів і вимірює відрізок часу від народження до смерті для кожного короеда.

    Популяція: Сукупність довжин життєвого циклу всіх короїдів

    Зразок: Набір довжин життєвого циклу 1000 короїдів

    1. Національна стрілецька асоціація хоче знати, який відсоток американців підтримує право носити зброю. Вони запитують 2500 американців, чи підтримують вони право носити зброю.

    Населення: Сукупність відповідей всіх американців на питання: «Чи підтримуєте ви право носити зброю?»

    Зразок: Набір відповідей від 2500 американців на питання: «Чи підтримуєте ви право носити зброю?»

    1. Дослідницький центр Pew запитав 1000 матерів у США, який їх найвищий рівень освіти був.

    Населення: Набір найвищих рівнів освіти всіх матерів у США

    Зразок: Набір найвищого рівня освіти 1000 матерів у США

    Дуже важливо, щоб ви зрозуміли, що ви намагаєтеся виміряти, перш ніж насправді виміряти його. Також зверніть увагу, що популяція - це сукупність вимірювань або спостережень, а не сукупність людей. Якщо ви говорите, що населення - це всі американці, то ви дали лише частину історії. Більш важливим є те, що ви вимірюєте від усіх американців. Питання в тому, чи хочете ви виміряти їх расу, колір очей, їх дохід, рівень освіти, кількість дітей, які вони мають, або інші змінні? Тому дуже важливо вказати, що ви вимірювали або спостерігали, і від кого або що були зроблені вимірювання або спостереження. Після того, як ви дізнаєтеся, що хочете виміряти або спостерігати, і джерело, з якого ви хочете зробити вимірювання або спостереження, вам потрібно зібрати дані.

    Набір даних - це сукупність значень, які називаються точками даних або значеннями даних. N представляє кількість точок даних у сукупності, а n - кількість точок даних у вибірці. Значення даних, яке набагато вище або нижче, ніж всі інші значення даних, називається викидом. Іноді викиди - це просто незвичайні значення даних, які дуже цікаві і їх слід вивчати далі, а іноді вони є помилками. Вам потрібно буде розібратися, який саме який.

    Для того, щоб зібрати дані, ми повинні розуміти типи змінних, які ми можемо збирати. Є насправді два різних типи змінних. Один називається якісним, а інший - кількісним.

    Якісна (Категорична) змінна: змінна, яка представляє характеристику. Якісні змінні за своєю суттю не є числами, тому їх не можна додавати, множити або усереднювати, але вони можуть бути представлені графічно за допомогою графіків, таких як гістограма.

    Приклади: стать, колір волосся, раса, національність, релігія, клас курсу, рік навчання в коледжі тощо.

    Кількісна (числова) змінна: змінна, яка представляє вимірювану величину. Кількісні змінні за своєю суттю числа, і тому їх можна додавати, множити, усереднювати та відображати графічно.

    Приклади: Зріст, вага, кількість котів, що належать, рахунок футбольного матчу тощо.

    Кількісні змінні можна розділити на інші категорії — неперервні та дискретні.

    Безперервна змінна: змінна, яка може приймати незліченну кількість значень у діапазоні. Іншими словами, змінна може бути будь-яке число в діапазоні значень. Безперервні змінні, як правило, речі, які вимірюються.

    Приклади: зріст, вага, розмір стопи, час здачі тесту, довжина і т.д.

    Дискретна змінна: змінна, яка може приймати тільки певні значення в діапазоні. Дискретні змінні, як правило, речі, які ви вважаєте.

    Приклади: IQ, розмір взуття, розмір сім'ї, кількість котів, що належать, рахунок у футбольному матчі тощо.

    Приклад\(\PageIndex{2}\): Визначення типів змінних

    Визначте, чи є кожна змінна кількісною чи якісною. Якщо він кількісний, то також визначте, безперервний він або дискретний.

    1. Тривалість забігу

    Кількісна і безперервна, так як ця змінна є числом і може приймати будь-яке значення в інтервалі.

    1. Думка людини про Президента

    Якісна, так як ця змінна не є числом.

    1. Колір будинку в мікрорайоні

    Якісна, так як ця змінна не є числом.

    1. Кількість будинків, які перебувають у зверненні стягнення в державі

    Кількісні та дискретні, оскільки ця змінна є числом, але може бути лише певними значеннями в інтервалі.

    1. Вага малюка при народженні

    Кількісна і безперервна, так як ця змінна є числом і може приймати будь-яке значення в інтервалі.

    1. Вищий рівень освіти матері

    Якісна, так як змінна не є числом.