14.2: Значні кореляції
- Page ID
- 53018
З огляду на спостережувану кореляцію, як ви можете визначити, чи є вона значною, а не випадковою? Ну, проблема розповіді, коли асоціація є значною, схожа на проблему розповіді, коли будь-яка статистика є значною. Справа в тому, що кореляція є значною, якщо ви можете довіряти їй у створенні своїх майбутніх прогнозів. І навпаки, спостережувана кореляція не є значною, якщо є хороший шанс, що вона з'явиться випадково і, таким чином, не буде надійною ознакою майбутніх подій. Однак ви, як правило, не в змозі виконати такий розрахунок значущості кореляції. Якщо ви зіткнулися з набором даних, які показують кореляцію, ви ніколи не зможете з'ясувати, чи є кореляція значною, якщо ви не збираєте більше даних. Якщо кореляція є просто випадковістю, вона зникне у більшому пулі даних, коли буде зібрано більше даних.
Якщо ви не можете зібрати більше даних і не можете попросити статистика обчислити коефіцієнт кореляції для вас, то єдиний інший спосіб визначити, чи є кореляція значною, - це побачити, чи дозволяють прийняті наукові теорії про те, як працює світ, передбачити, що кореляція буде триматися. Наприклад, припустимо, у вас є всі доступні дані про дитинство Наполеона Бонапарта, і ви виявите позитивну кореляцію між його зростом в дитинстві та віком в дитинстві. Чи є кореляція значущою? Ви не можете збирати більше даних про дитинство Наполеона; у вас є все, що потрібно мати. Ви не можете почати його життя заново і збирати дані про його дитинство протягом другого життя. Тим не менш, ви знаєте, що співвідношення між його зростом і віком не випадково, тому що ви тримаєте цілком виправдану теорію про біології людини, що означає, що висота в дитинстві збільшується з віком. Якщо цей зв'язок стосується всіх, то вона стосується і французьких імператорів. Так що кореляція в даних Наполеона значна. Підсумовуючи це, щоб вирішити, чи є кореляція випадковою, ви можете спробувати зібрати більше даних, або ви можете звернутися до наших теоретичних знань, щоб визначити, чи повинна бути кореляція.
Вправа\(\PageIndex{1}\)
Яка історія стоїть за кореляцією в уривку нижче?
На тлі непроникного жаргону Уолл-стріт та прогнозів на фондовому ринку в 1984 році приходить цей самородок дурості: якщо Вашингтонські червоношкірні виграють Суперкубок цієї неділі, ринок йде вгору. Або, навпаки, якщо ви думаєте, що ринок зростає в цьому році, ви повинні покласти свої гроші на червоношкірих.
Якщо цей метод прогнозування ринку звучить як нісенітниця, ви в хорошій компанії. Але врахуйте так: результати Суперкубка стали... сигналом майбутньої ринкової активності.
У 17 іграх Super Bowl, які грали з 1967 року, щороку [в яких] команда Національної футбольної конференції виграла, складовий індекс Нью-Йоркської фондової біржі закінчив рік з виграшем. І в кожному році, в якому перемагала команда American Football Conference, ринок затонув. 1
- Ця кореляція викликана важкими ставками на результати Суперкубка.
- Існує кореляція, оскільки результати гри викликали інвестиції на фондовий ринок футболістів.
- Кореляція - це збіг (тобто не значна асоціація).
- Кореляцію можна використовувати як надійний показник того, що якщо NFC виграв Суперкубок минулого разу, то AFC виграє наступного разу.
- Відповідь
-
Відповідь (c). Візерунок не продовжиться і надалі. Це нещасний випадок. Відповідь (а) навряд чи буде правильною, оскільки ставки навряд чи так радикально вплинуть на біржу
Чим сильніше кореляція, тим більша ймовірність того, що за нею існує якась причинно-наслідкова зв'язок або якась причинна історія. Слідчі зазвичай зацікавлені в тому, щоб дізнатися подробиці цієї причинної історії; це центральна тема наступного розділу, але ось слово застереження: Півень воронить, потім сонце сходить. Він цього не викликав, чи не так?
1 Р. Фостер Вінанс, «Уолл-стріт обмірковує, якщо ринок биків у '84 петлі на червоношкірих», The Wall Street Journal, січень 18, 1984, стор. 49.