6.3.1: Шукаємо асоціації
- Page ID
- 57608
Урок
Давайте пошукаємо асоціації в даних.
Вправа\(\PageIndex{1}\): Notice and Wonder: Bar Association
Що ви помічаєте? Що вам цікаво?

Вправа\(\PageIndex{2}\): Card Sort: Matching Representations
Ваш вчитель роздасть кілька карток.
Деякі картки показують двосторонні таблиці, як це:
| має стільниковий телефон | не має стільникового телефону | всього | |
|---|---|---|---|
| Від 10 до 12 років | 25 | 35 | 60 |
| Від 13 до 15 років | 40 | 10 | 50 |
| Від 16 до 18 років | 50 | 10 | 60 |
| всього | 115 | 55 | 170 |
Деякі картки показують гістограми, як це:

Деякі картки показують сегментовані гістограми, як це:

Гістограми та сегментовані гістограми мають свої мітки видалені.
- Покладіть всі карти, які описують одну і ту ж ситуацію, в одну групу.
- Одна з груп не має двостороннього столу. Складіть двосторонню таблицю для ситуації, описаної графіками в групі.
- Позначте гістограми та сегментовані гістограми так, щоб були вказані категорії, представлені кожним стовпчиком.
- Опишіть своїми словами вид інформації, яку показує сегментована гістограма.
Ви готові до більшого?
Одна з сегментованих гістограм відсутня. Побудувати сегментовану гістограму, яка відповідає іншим представленням.
Вправа\(\PageIndex{3}\): Building Another Type of Two-Way Table
Ось двостороння таблиця, яка показує дані про використання стільникового телефону серед дітей віком від 10 до 18 років.
| має стільниковий телефон | не має стільникового телефону | всього | |
|---|---|---|---|
| Від 10 до 12 років | 25 | 35 | 60 |
| Від 13 до 15 років | 40 | 10 | 50 |
| Від 16 до 18 років | 50 | 10 | 60 |
| всього | 115 | 55 | 170 |
1. Доповніть таблицю. У кожному рядку записи для «має стільниковий телефон» та «не має стільникового телефону» повинні мати загальну суму 100%. Округлення записів до найближчого процентного пункту.
| має стільниковий телефон | не має стільникового телефону | всього | |
|---|---|---|---|
| Від 10 до 12 років | 42% | ||
| Від 13 до 15 років | 100% | ||
| Від 16 до 18 років | 17% |
Це як і раніше двосторонній стіл. Замість того, щоб показувати частоту, ця таблиця показує відносну частоту.
2. Двосторонні таблиці, які показують відносні частоти, часто не містять «загальний» рядок внизу. Чому?
3. Чи існує зв'язок між віком та використанням мобільного телефону? Як двостороння таблиця відносних частот допомагає це проілюструвати?
Ви готові до більшого?
Опитувач відвідує мітинг і опитує багатьох учасників про те, чи вони асоціюються з політичною партією А або політичною партією B, і чи є вони за чи проти пропозиції 3.14 збирається на голосування найближчим часом. Результати відсортовані в наведену таблицю.
| для | проти | |
|---|---|---|
| партія А | 832 | 165 |
| партія B | 80 | 160 |
- Інформаційна станція повідомляє про ці результати, кажучи: «Опитування показує, що приблизно однакова кількість людей з обох партій голосує проти Пропозиції 3.14».
- Друга новинна станція показує цю графіку.

- Чи вводять якісь новини в оману? Поясніть свої міркування.
- Створіть заголовок, графіку та короткий опис, що більш точно відображає дані в таблиці.
Резюме
Коли ми збираємо дані, підраховуючи речі в різних категоріях, як-от червоний, синій або жовтий, ми називаємо дані категоріальними даними, і ми говоримо, що колір - це категорична змінна.
Ми можемо використовувати двосторонні таблиці для дослідження можливих зв'язків між двома категоріальними змінними. Наприклад, ця двостороння таблиця частот показує результати дослідження медитації і душевного стану спортсменів перед зустріччю треку.
| медитував | не медитував | всього | |
|---|---|---|---|
| спокійний | 45 | 8 | 53 |
| схвильований | 23 | 21 | 44 |
| всього | 68 | 29 | 97 |
Якщо нас цікавить питання про те, чи існує зв'язок між медитацією та спокоєм, ми можемо представити частоти в гістограмі, групуючи дані про медитаторів та групуючи дані про немедитаторів, щоб ми могли порівняти кількість спокійних та схвильованих спортсменів у кожній групі.

Зверніть увагу, що кількість спортсменів, які не медитували, невелика порівняно з числом, хто медитував (29 порівняно з 68, як показано в таблиці).
Якщо ми хочемо знати пропорції спокійних медитаторів і спокійних немедитаторів, ми можемо скласти двосторонню таблицю відносних частот і представити відносні частоти в сегментованій гістограмі.
| медитував | не медитував | |
|---|---|---|
| спокійний | 66% | 28% |
| схвильований | 34% | 72% |
| всього | 100% | 100% |

Записи глосарію
Визначення: Відносна частота
Відносна частота категорії говорить нам про пропорцію, при якій категорія зустрічається у наборі даних. Він виражається у вигляді дробу, десяткового або відсотка від загального числа.
Наприклад, припустимо, що в парку було 21 собака, деякі білі, деякі коричневі, деякі чорні, а деякі багатобарвні. У таблиці вказана частота і відносна частота кожного кольору.
| колір | частоти | відносна частота |
|---|---|---|
| білий | \(5\) | \(\frac{5}{21}\) |
| коричневий | \(7\) | \(\frac{7}{21}\) |
| чорний | \(3\) | \(\frac{3}{21}\) |
| багатобарвний | \(6\) | \(\frac{6}{21}\) |
Визначення: Сегментована гістограма
Сегментована гістограма порівнює дві категорії в наборі даних. Весь бар представляє всі дані в межах однієї категорії. Потім кожен брусок розділяється на частини (сегменти), які показують відсоток кожної частини в другій категорії.

Ця сегментована гістограма показує відсоток людей у різних вікових групах, які роблять і не мають мобільного телефону. Наприклад, серед людей віком від 10 до 12 років близько 40% мають мобільний телефон, а 60% не мають мобільного телефону.
Визначення: Двостороння таблиця
Двостороння таблиця забезпечує спосіб порівняння двох категоріальних змінних.
Він показує одну зі змінних у верхній частині, а іншу вниз з одного боку. Кожен запис у таблиці є частотою або відносною частотою категорії, яка відображається заголовками стовпців та рядків.
Дослідження досліджує зв'язок між медитацією та душевним станом спортсменів перед зустріччю треку. Ця двостороння таблиця показує результати дослідження.
| медитував | не медитував | всього | |
|---|---|---|---|
| спокійний | 45 | 8 | 53 |
| схвильований | 23 | 21 | 44 |
| всього | 68 | 29 | 97 |
Практика
Вправа\(\PageIndex{4}\)
Вчений хоче знати, чи впливає колір води на те, скільки п'ють тварини. Середня кількість води, яку п'є кожна тварина, була зафіксована в мілілітрах протягом тижня, а потім графічна. Чи є докази, які свідчать про зв'язок між кольором води та твариною?
| споживання котів (мл) | прийом собак (мл) | всього (мл) | |
|---|---|---|---|
| блакитна вода | 210 | 1200 | 1410 |
| зелена вода | 200 | 1100 | 1300 |
| всього | 410 | 2300 | 2710 |

Вправа\(\PageIndex{5}\)
Фермер приносить свою продукцію на ринок фермера і записує, чи купують люди салат, яблука, обидва, або щось інше.
| купив яблука | яблука не купила | |
|---|---|---|
| купив салат | 14 | 58 |
| салат не купив | 8 | 29 |
Складіть таблицю, яка показує відносні частоти для кожного рядка. Скористайтеся цією таблицею, щоб вирішити, чи існує зв'язок між покупкою салату та покупкою яблук.
Вправа\(\PageIndex{6}\)
Дослідники медіа-компанії хочуть вивчати звички читання новин серед різних вікових груп. Вони відстежували дані друку та онлайн-підписки та склали двосторонню таблицю.
| інтернет змі | друковані ЗМІ | |
|---|---|---|
| 18-25 років | 151 | 28 |
| 26-45 років | 132 | 72 |
| 46-65 років | 48 | 165 |
- Створіть сегментовану гістограму, використовуючи один бар для кожного рядка таблиці.
- Чи існує зв'язок між віковими групами та методом, який вони використовують для читання статей? Поясніть свої міркування.
Вправа\(\PageIndex{7}\)
Використовуючи дані в графіку розкиду, який розумний нахил моделі, яка відповідає цим даними?

- \(-2.5\)
- \(-1\)
- \(1\)
- \(2.5\)
(Від блоку 6.2.4)
