1.1: Вступ та приклади
- Page ID
- 97253
Перше визначення уточнює поняття аналізу часових рядів.
Визначення 1.1.1: Часовий ряд
\(T \neq \emptyset\)Дозволяти бути набір індексу, зручно розглядається як «час». Сімейство\((X_t\colon t\in T)\) випадкових величин (випадкових функцій) називається стохастичним процесом. Реалізація\((X_t\colon t\in T)\) називається часовим рядом. Ми будемо використовувати позначення\((x_t\colon t\in T)\) в дискурсі.
Найпоширеніші варіанти набору індексів T включають цілі числа\(\mathbb{Z}=\{0,\pm 1,\pm 2,\ldots\}\), натуральні числа\(\mathbb{N}=\{1,2,\ldots\}\), невід'ємні цілі числа\(\mathbb{N}_0=\{0,1,2,\ldots\}\), дійсні числа\(\mathbb{R}=(-\infty,\infty)\) та додатну півлінію\(\mathbb{R}_+=[0,\infty)\). Цей клас в основному стосується перших трьох випадків, які підводяться під поняття дискретного аналізу часових рядів.
Часто стохастичний процес сам\((X_t\colon t\in T)\) називають часовим рядом, в тому сенсі, що реалізація ототожнюється з імовірнісним механізмом генерування. Мета аналізу часових рядів полягає в отриманні знань про це основне випадкове явище шляхом вивчення однієї (і, як правило, лише однієї) реалізації. Це відокремлює аналіз часових рядів від, скажімо, регресійного аналізу для незалежних даних.
Нижче наведено ряд прикладів, що підкреслюють безліч можливих застосувань аналізу часових рядів у різних наукових галузях.
Приклад 1.1.1 (Числа сонячних плям A\(\ddot{\mbox{o}}\) lfer). На малюнку 1.1 кількість сонячних плям (тобто темних плям, помітних на поверхні сонця), що спостерігаються щорічно, наноситься проти часу. Горизонтальна вісь позначає час у роках, тоді як вертикальна вісь представляє спостережувані\(x_t\) значення випадкової величини
\[ X_t=\#\mbox{ of sunspots at time $t$},\qquad t=1700,\ldots,1994. \nonumber \]
Фігура називається сюжетом часового ряду. Це корисний прилад для попереднього аналізу. Числа сонячних плям використовуються для пояснення магнітних коливань на поверхні сонця.

Малюнок 1.1: Сонячна пляма Вельфера з 1700 по 1994 рік.
Щоб відтворити версію графіка часових рядів на рис. 1.1 за допомогою безкоштовного програмного пакету R (завантаження доступні за адресою http://cran.r-project.org), завантажте файл sunspots.dat з веб-сторінки курсу та введіть такі команди:
> плями = читання.таблиця (» sunspots.dat «)
> плями = ts (плями, початок = 1700, частота = 1)
> сюжет (плями, xlab = «час», ylab = "», main="Кількість сонячних плям»)
У першому рядку файл sunspots.dat зчитується в споти об'єкта, який потім у другому рядку трансформується в об'єкт часового ряду за допомогою функції ts (). Використання start встановлює початкове значення для осі x до заданого числа, тоді як частота встановлює кількість спостережень за одну одиницю часу. (Тут: одне щорічне спостереження.) Нарешті, plot - це стандартна команда побудови графіків у R, де xlab та ylab визначають мітки для осі x та y -осі відповідно, а main дає заголовок.
Приклад 1.1.2 (дані канадської рисі). Графік часових рядів на малюнку 1.2 походить від набору біологічних даних. Він містить щорічні прибутки рисі на аукціоні в Лондоні компанією Хадсон-Бей з 1821—1934 років (за\(log_{10}\) шкалою). Вони розглядаються як спостереження стохастичного процесу
\[ X_t=\log_{10}(\mbox{number of lynx trapped at time $1820+t$}), \qquad t=1,\ldots,114. \nonumber \]

Малюнок 1.2: Кількість рисі, що потрапила в пастку в районі річки Маккензі між 1821 і 1934 роками.
Дані використовуються як оцінка кількості всіх рисей, що опинилися в пастці вздовж річки Маккензі в Канаді. Ця оцінка, в свою чергу, часто приймається як проксі для справжньої чисельності популяції рисі. Аналогічний сюжет часового ряду можна було отримати і для кроля-снігоступа, основного джерела їжі канадської рисі, натякаючи на хитромудрі відносини хижак-здобич.
Припускаючи, що дані зберігаються у файлі lynx.dat, відповідні команди R, що ведуть до графіку часового ряду на малюнку 1.2, такі:
> рись = читання.таблиця (» lynx.dat «)
> рись = ts (log10 (рись), початок = 1821, частота = 1)
> сюжет (рись, xlab ="», ylab= "», main="Кількість захоплених рисі»)
Приклад 1.1.3 (Казначейські векселі). Ще одна важлива сфера застосування для аналізу часових рядів полягає в галузі фінансів. Для хеджування ризиків портфелів інвестори зазвичай використовують короткострокові безризикові процентні ставки, такі як прибутковість тримісячних, шестимісячних та дванадцятимісячних казначейських векселів, побудованих на малюнку 1.3. Показані (багатоваріантні) дані складаються з 2386 щотижневих спостережень з 17 липня 1959 року по 31 грудня 1999 року. Ось,
\[ X_t=(X_{t,1},X_{t,2},X_{t,3}), \qquad t=1,\ldots,2386, \nonumber \]
де\(X_{t,1}\),\(X_{t,2}\) і\(X_{t,3}\) позначають тримісячну, шестимісячну і дванадцятимісячну врожайність на час t відповідно. З графіка видно, що всі три казначейські векселі рухаються дуже аналогічно з часом, маючи на увазі високу кореляцію між компонентами\(X_t\).

Малюнок 1.3: Прибутковість казначейських векселів з 17 липня 1959 року по 31 грудня 1999 року.

Малюнок 1.4: S&P 500 з 3 січня 1972 року по 31 грудня 1999 року.
Для отримання графіка з трьома варіантами часових рядів на малюнку 1.3 використовуйте код R
> рахунки 03 = читання.таблиця (» bills03.dat «);
> рахунки 06 = читання.таблиця (» bills06.dat «);
> рахунки 12 = читання.таблиця (» bills12.dat «);
> пар (mfrow = c (3,1))
> ділянка.тс (рахунки 03, xlab =" (a)», ylab = "»,
main = «Прибутковість 3-місячних казначейських векселів»)
> ділянка.тс (рахунки 06, xlab = "(b)», ylab = "»,
main="Прибутковість 6-місячних казначейських векселів»)
> ділянка.тс (рахунки 12, xlab = "(c)», ylab = "»,
main="Прибутковість 12-місячних казначейських векселів»)
Знову ж таки передбачається, що дані можна знайти у відповідних файлах bills03.dat, bills06.dat і bills12.dat. Командний рядок par (mfrow=c (3,1)) використовується для налаштування графіки. Це дозволяє зберегти три різних графіки в одному файлі.
Приклад 1.1.4 (S&P 500). Індекс Standard and Poor's 500 (S&P 500) - це цінно-зважений індекс на основі цін 500 акцій, на які припадає приблизно 70% капіталізації ринку акцій США. Це провідний економічний показник, а також використовується для хеджування ринкових портфелів. Рисунок 1.4 містить 7 076 щоденних цін закриття S&P 500 з 3 січня 1972 року по 31 грудня 1999 року за натуральною шкалою логарифма. Це, отже, графік часового ряду процесу
\[ X_t=\ln(\mbox{closing price of S&P 500 at time $t$}), \qquad t=1,\ldots,7076. \nonumber \]
Зверніть увагу, що перетворення логарифма було застосовано, щоб зробити прибутковість прямо порівнянною з відсотком прибутковості інвестицій. Графік часового ряду можна відтворити в R за допомогою файлу sp500.dat
Існує незліченна кількість інших прикладів з усіх областей науки. Щоб розробити теорію, здатну обробляти широкі програми, статистику потрібно покладатися на математичну основу, яка може пояснити такі явища, як
- тенденції (видно в прикладі 1.1.4);
- сезонні або циклічні ефекти (видно в прикладах 1.1.1 і 1.1.2);
- випадкові коливання (всі приклади);
- залежність (всі приклади?).
Класичний підхід, прийнятий при аналізі часових рядів, полягає в постуляції, що\((X_t\colon t\in T)\) досліджуваний стохастичний процес можна розділити на детерміновані трендові та сезонні компоненти плюс центровану випадкову складову, що породжує модель.
\[X_t=m_t+s_t+Y_t, \qquad t\in T \tag{1.1.1} \]
де\((m_t\colon t\in T)\) позначається функція тренду («середня складова»),\((s_t\colon t\in T)\) сезонні ефекти і\((Y_t\colon t\in T)\) (нульове середнє) стохастичний процес. Після того, як буде обрана відповідна модель, статистик може прагнути
- оцінка параметрів моделі для кращого розуміння часових рядів;
- прогнозування майбутніх цінностей, наприклад, для розробки інвестиційних стратегій;
- перевірка правильності прилягання до даних, щоб підтвердити, що обрана модель відповідна.
Процедури оцінки та методи прогнозування детально розглядаються в наступних розділах заміток. Решта цієї глави буде присвячена впровадженню класів строго і слабо стаціонарних стохастичних процесів (у розділі 1.2) та забезпеченню інструментів для усунення тенденцій та сезонних компонентів із заданого часового ряду (у розділах 1.3 та 1.4), тоді як деякі достовірності тестів на придатність будуть представлені в Розділ 1.5.
