Skip to main content
LibreTexts - Ukrayinska

1.4: Усунення тенденцій та сезонних компонентів

  • Page ID
    97242
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)

    Нагадаємо класичне розкладання (1.1.1),
    \ [
    x_t=m_t+S_T+Y_t,\ qquad t\ in T,
    \ nonumber\]
    с\(E[Y_t]=0\). У цьому розділі обговорюються три методи, спрямовані на оцінку як трендових, так і сезонних компонентів даних. В якості додаткової вимоги передбачається\((s_t\colon t\in T)\), що
    \ [
    s_ {t+d} =s_t,\ qquad\ sum_ {j=1} ^ds_j=0,
    \ nonumber\]
    де\(d\) позначає період сезонної складової. (Якщо мова йде про щорічні дані, вибіркові щомісяця, то очевидно\(d=12\).) Зручно позначити спостереження\(x_1,\ldots,x_n\) за сезонним періодом\(d\) як
    \ [x_ {j, k} =x_ {k+d (j-1)}.
    \ nonnumber\]
    У випадку річних даних спостереження\(x_{j,k}\) таким чином являє собою точку даних, яка спостерігається за місяць\(k\)\(j\) го року. Для зручності дані завжди згадуються таким чином, навіть якщо фактичний період є чимось іншим, ніж 12.

    Спосіб 1 (Метод малого тренда) Якщо зміни терміну дрейфу здаються невеликими, то розумно припустити, що дрейф в році\(j\), скажімо,\(m_j\) постійний. Тому як природний оцінювач можна застосувати
    \ [
    \ hat {m} _j=\ frac {1} {d}\ sum_ {k=1} ^dx_ {j, k}.
    \ nonumber\]
    Для оцінки сезонності в даних можна на другому етапі використовувати величини
    \ [
    \ hat {s} _k=\ frac 1N\ sum_ {j=1} ^N (x_ {j, k} -\ hat {m} _j),
    \ nonumber\]
    де\(N\) визначається рівняння\(n=Nd\), за умови, що дані були зібрані протягом\(N\) повних циклів. Прямі розрахунки показують, що ці оцінювачі володіють властивістю\(\hat{s}_1+\ldots+\hat{s}_d=0\) (як у випадку з істинними сезонними складовими\(s_t\)). Для подальшої оцінки якості прилягання потрібно проаналізувати спостережувані залишки
    \ [
    \ hat {y} _ {j, k} =x_ {j, k} -\ hat {m} _j-\ hat {s} _k.
    \ nonumber\]
    Зауважте, що завдяки маркуванню спостережень і припущенню повільно мінливої тенденції, Компонент дрейфу описується виключно «річним»\(j\) індексом, тоді як сезонний компонент містить лише «щомісячний» індекс\(k\).

    • Малюнок 1.10: Графіки часових рядів продажів червоного вина в Австралії з січня 1980 по жовтень 1991 (зліва) та його перетворення журналу з середніми річними оцінками (праворуч).

    Приклад 1.4.1 (Продаж австралійських вин). На лівій панелі малюнка 1.10 показані щомісячні продажі червоного вина (в кілолітрах) в Австралії з січня 1980 по жовтень 1991 року. Оскільки спостерігається явне збільшення коливань з плином часу, на правій панелі цього ж малюнка показано природне перетворення логарифма даних. Є чіткі докази як тренду, так і сезонності. Далі вивчається журнал трансформованих даних. Використовуючи метод малого тренду, як описано вище, спочатку оцінюються річні кошти. Вони вже включені в потрібний графік часового ряду на малюнку 1.10. Зверніть увагу, що є лише десять місяців даних за рік 1991, так що оцінка повинна бути скоригована відповідним чином. Визначені дані показані на лівій панелі малюнка 1.11. Середній графік на тому ж малюнку показує передбачувану сезонну складову, тоді як на правій панелі відображаються залишки. Незважаючи на те, що припущення про невеликі зміни в дрейфі є дещо сумнівним, залишки виглядають досить приємно. Вони вказують на наявність залежності в даних (докладніше про цю тему див. Розділ 1.5 нижче).

    • Малюнок 1.11: Визначена серія журналів (зліва), передбачувана сезонна складова (центр) та відповідні ряди залишків (праворуч) австралійських даних про продаж червоного вина.

    Метод 2 (Оцінка ковзної середньої) Цей метод має бути кращим перед першим, коли базовий компонент тренду не можна вважати постійним. Три кроки повинні бути застосовані до даних.

    1-й крок: оцінка тренду. Спочатку зосередьтеся на видаленні трендової складової за допомогою лінійних фільтрів, розглянутих у попередньому розділі. Якщо період\(d\) непарний, то можна безпосередньо використовувати\(\hat{m}_t=W_t\) як в (1.3.2) із\(q\) заданим рівнянням\(d=2q+1\). Якщо період\(d=2q\) парний, то трохи змініть\(W_t\) і використовувати
    \ [
    \ hat {m} _t=\ frac 1d (.5x_ {t-q} +x_ {t-q+1} +\ ldots+x_ {t+q-1} +.5x_ {t+q}),
    \ qquad t=q+1,\ ldots, n-q.
    \ номер\]

    2-й крок: оцінка сезонності. Для оцінки сезонної складової давайте
    \ почнемо {align*}
    \ mu_k&=\ frac 1 {N-1}\ sum_ {j=2} ^N (x_ {k+d (j-1)} -\ hat {m} _ {k+d (j-1)}),
    \ qquad k=1,\ ldots, q,\\ [.2cm]
    \ mu_k&=\ розрив 1 {N-1}\ sum_ {j=1} ^ {N-1} (x_ {k+d (j-1)} -\ капелюх {m} _ {k+d (j-1)}),
    \ qquad k=q+1,\ ldots, d.
    \ end {align*}
    Визначте зараз

    \ [\ капелюх {s} _k=\ mu_k-\ frac 1d\ sum_ {\ ell=1} ^d\ mu_\ ell,\ qquad k=1,\ ldots, d,
    \ nonumber\]
    і встановити\(\hat{s}_{k}=\hat{s}_{k-d}\) щоразу\(k>d\). Це надасть нам десезонні дані, які можна вивчити далі. На останньому етапі з даних можна видалити будь-яку тенденцію, що залишилася.

    3-й крок: Переоцінка тренду. Застосовуйте будь-який з методів з розділу 1.3.

    Метод 3 (Різниця при відставанні d) Введення оператора різниці lag-d\(\nabla_d\), визначеного дозволом
    \ [
    \ nabla_dx_t=x_t_x_ {t-d} =( 1-b^d) x_t,\ qquad t=d+1,\ ldots, n,
    \ nonumber\]
    і припускаючи модель (1.1.1), один приходить на перетворені випадкові величини

    \ [\ naBla_dx_t=m_t_t_ {t-d} +y_t-y_ {t-d},\ qquad t=d+1,\ ldots, n.
    \ nonumber\]
    Зверніть увагу, що сезонність видаляється, так як\(s_t=s_{t-d}\). Решта змінні шуму\(Y_t-Y_{t-d}\) є стаціонарними і мають нульове середнє значення. Нова складова тренду\(m_t-m_{t-d}\) може бути усунена за допомогою будь-якого з методів, розроблених у розділі 1.3.

    • Малюнок 1.12: Різниця спостережуваних рядів\(\nabla_{12}x_t\) (зліва),\(\nabla x_t\) (посередині) та\(\nabla\nabla_{12}x_t=\nabla_{12}\nabla x_t\) (праворуч) для австралійських даних про продаж червоного вина.

    Приклад 1.4.2 (продаж австралійських вин). Перегляньте австралійські дані про продаж червоного вина Приклад 1.4.1 та застосуйте щойно встановлені методи відмінності. Лівий графік малюнка 1.12 показує дані після застосування оператора\(\nabla_{12}\). Якщо тренд, що залишився в даних оцінюється методом відмінності від розділу 1.3, то виходить залишкова ділянка, наведена в правій панелі малюнка 1.12. Зверніть увагу, що порядок застосування не змінює залишки, тобто\(\nabla\nabla_{12}x_t=\nabla_{12}\nabla x_t\). На середній панелі рисунка 1.12 відображаються відмінні дані, які все ще містять сезонну складову.