Skip to main content
LibreTexts - Ukrayinska

11: Пошук структури в даних

  • Page ID
    17701
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Одним з найбільш інтригуючих аспектів хемометрики є здатність виявляти та витягувати інформацію з великого набору даних, який, на перший погляд, не має певного порядку. І все ж, цілком ймовірно, що існують визначальні фактори, які пояснюють дані. Розглянемо набір даних, який складається з добової концентрації NOX - комбінованих кількостях NO 2 та NO у повітрі, виражених як мкг/м 3 - у зразках міського повітря. Хоча сюжет концентрації NOX як функції часу, ймовірно, здається галасливим, ми можемо легко визначити змінні, які можуть вплинути на щоденні вимірювання:

    • температура: нам потрібно більше енергії в холодні дні, що збільшує використання палива, що генерує викиди NOX
    • день тижня: можливо, більше трафіку в робочі дні, ніж у вихідні
    • атмосферні умови: сильні вітри можуть розсіювати викиди NOX, а стагнація може концентрувати викиди NOX
    • розташування пробовідбірників повітря: пробовідбірники на жвавих перехрестях можуть давати різні результати від пробовідбірників, розташованих у міських парках

    Хімометричні методи, представлені в цій главі - кластерний аналіз, аналіз основних компонентів та багатоваріантна лінійна регресія - забезпечують способи дослідження основних факторів, які забезпечують структуру наших даних.