Skip to main content
LibreTexts - Ukrayinska

11.1: Що ми маємо на увазі під структурою?

  • Page ID
    17741
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Сигнали, які ми вимірюємо, включають внески з визначених та невизначених джерел, з визначеними компонентами, отриманими в результаті аналітів у нашому зразку, та з невизначені джерела, що виникають внаслідок шуму. Коли ми описуємо наші дані як мають структуру, або що ми шукаємо структуру в наших даних, наш інтерес полягає в визначених внесках у сигнал. Розглянемо, наприклад, дані на наступному малюнку, який показує видимі спектри для 24 зразків на 635 довжині хвиль.

    малюнок 11.1.1.png
    Рисунок\(\PageIndex{1}\): Видимі спектри для 24 зразків, записаних на 635 довжині хвиль між 380,5 нм і 889,5 нм. Спектр червоним кольором виділяє один із 24 спектрів, включених у цей набір даних.

    Кожна крива на цьому малюнку, наприклад, показана червоним кольором, є однією з 24 зразків, що складають цей набір даних, і показує, наскільки кожна з 635 дискретних довжин хвиль світла поглинається цим зразком: це визначальний внесок у дані. Придивляючись до спектру, показаного червоним кольором, ми бачимо невеликі варіації поглинання, накладеного на детермінантний сигнал: це невизначений внесок у дані.

    Хоча при першому дослідженні 24 спектри на малюнку\(\PageIndex{1}\) можуть створити відчуття розладу, існує чітка основна структура даних. Наприклад, є чотири видимі піки, зосереджені на довжині хвиль близько 400 нм, 500 нм, 580 нм та 800 нм. Кожен з окремих спектрів включає один або кілька з цих піків. Крім того, на довжині хвилі 800 нм ми бачимо, що деякі зразки не показують поглинання і, мабуть, не мають будь-якого аналіту, який відповідає за цей пік; інші зразки, однак, чітко включають внесок цього аналіту. Це те, що ми маємо на увазі під знаходженням структури в даних. У цьому розділі ми досліджуємо три інструменти для пошуку структури даних - кластерний аналіз, аналіз основних компонентів та багатоваріантна лінійна регресія - які дозволяють нам зрозуміти цю структуру.