11.1: Що ми маємо на увазі під структурою?
- Page ID
- 17741
Сигнали, які ми вимірюємо, включають внески з визначених та невизначених джерел, з визначеними компонентами, отриманими в результаті аналітів у нашому зразку, та з невизначені джерела, що виникають внаслідок шуму. Коли ми описуємо наші дані як мають структуру, або що ми шукаємо структуру в наших даних, наш інтерес полягає в визначених внесках у сигнал. Розглянемо, наприклад, дані на наступному малюнку, який показує видимі спектри для 24 зразків на 635 довжині хвиль.
Кожна крива на цьому малюнку, наприклад, показана червоним кольором, є однією з 24 зразків, що складають цей набір даних, і показує, наскільки кожна з 635 дискретних довжин хвиль світла поглинається цим зразком: це визначальний внесок у дані. Придивляючись до спектру, показаного червоним кольором, ми бачимо невеликі варіації поглинання, накладеного на детермінантний сигнал: це невизначений внесок у дані.
Хоча при першому дослідженні 24 спектри на малюнку\(\PageIndex{1}\) можуть створити відчуття розладу, існує чітка основна структура даних. Наприклад, є чотири видимі піки, зосереджені на довжині хвиль близько 400 нм, 500 нм, 580 нм та 800 нм. Кожен з окремих спектрів включає один або кілька з цих піків. Крім того, на довжині хвилі 800 нм ми бачимо, що деякі зразки не показують поглинання і, мабуть, не мають будь-якого аналіту, який відповідає за цей пік; інші зразки, однак, чітко включають внесок цього аналіту. Це те, що ми маємо на увазі під знаходженням структури в даних. У цьому розділі ми досліджуємо три інструменти для пошуку структури даних - кластерний аналіз, аналіз основних компонентів та багатоваріантна лінійна регресія - які дозволяють нам зрозуміти цю структуру.