4.3: Великі властивості зразка
- Page ID
- 97215
\((X_t\colon t\in\mathbb{Z})\)Дозволяти бути слабо стаціонарний часовий ряд із\(\mu\) середньою, абсолютно сумованою ACVF\(\gamma(h)\) і спектральною щільністю\(f(\omega)\). Продовжуючи, як у доведенні Пропозиції4.2.2., отримується
\[ I(\omega_j)=\frac 1n\sum_{h={-n+1}}^{n-1}\sum_{t=1}^{n-|h|}(X_{t+|h|}-\mu)(X_t-\mu)\exp(-2\pi i\omega_jh), \label{Eq1} \]
за умови\(\omega_j\not=0\). Використовуючи це уявлення, можна встановити граничну поведінку періодограми.
Пропозиція 4.3.1
Нехай\(I(\cdot)\) буде періодограма, заснована на спостереженнях\(X_1,\ldots,X_n\) слабо стаціонарного процесу\((X_t\colon t\in\mathbb{Z})\), то, для будь-якого\(\omega\not=0\),
\[ E[I(\omega_{j:n})]\to f(\omega)\qquad(n\to\infty), \nonumber \]
де\(\omega_{j:n}=j_n/n\) з\((j_n)_{n\in\mathbb{N}}\) обраний такий, що\(\omega_{j:n}\to\omega\) як\(n\to\infty\). Якщо\(\omega=0\), то
\[ E[I(0)]-n\mu^2\to f(0)\qquad(n\to\infty). \nonumber \]
Доказ. Існують два обмеження, що беруть участь в обчисленнях середнє значення періодограми. Спочатку візьміть ліміт як\(n\to\infty\). Це, однак, вимагає, по-друге, щоб для кожного\(n\) нам довелося працювати з різним набором частот Фур'є. Щоб підлаштуватися під це, ми ввели позначення\(\omega_{j:n}\). Якщо\(\omega_j\not=0\) частота Фур'є (\(n\)фіксована!) , потім
\[ E[I(\omega_j)]=\sum_{h=-n+1}^{n-1}\left(\frac{n-|h|}{n}\right)\gamma(h)\exp(-2\pi i\omega_jh). \nonumber \]
Тому (\(n\to\infty\)!) ,
\[ E[I(\omega_{j:n})]\to\sum_{h=-\infty}^\infty\gamma(h)\exp(-2\pi i\omega h)=f(\omega), \nonumber \]
доводячи тим самим першу претензію. Другий випливає з\(I(0)=n\bar{X}_n^2\) (див. Пропозиція 4.2.2.), так,\(E[I(0)]-n\mu^2=n(E[\bar{X}_n^2]-\mu^2)=n\mbox{Var}(\bar{X}_n) \to f(0)\)\(n\to\infty\) як у главі 2. Доказ повний.
Пропозиція 4.3.1. показує, що\(I(\omega)\) періодограма асимптотично неупереджена для\(f(\omega)\). Це, однак, непослідовно. Це мається на увазі наступна пропозиція, яка дається без доказів. Не дивно, враховуючи, що кожне значення\(I(\omega_j)\) є сумою квадратів лише двох випадкових величин незалежно від розміру вибірки.
Пропозиція 4.3.2.
Якщо\((X_t\colon t\in\mathbb{Z})\) є (причинний або непричинний) слабо стаціонарний часовий ряд такий, що
\[ X_t=\sum_{j=-\infty}^\infty\psi_jZ_{t-j},\qquad t\in\mathbb{Z}, \nonumber \]
з\(\sum_{j=-\infty}^\infty|\psi_j|<\infty and (Z_t)_{t\in\mathbb{Z}}\sim\mbox{WN}(0,\sigma^2)\), потім
\[ (\frac{2I(\omega_{1:n})}{f(\omega_1)},\ldots,\frac{2I(\omega_{m:n})}{f(\omega_m)}) \stackrel{\cal D}{\to}(\xi_1,\ldots,\xi_m), \nonumber \]
де\(\omega_1,\ldots,\omega_m\)\(m\) різні\(\omega_{j:n}\to\omega_j\) частоти з і\(f(\omega_j)>0\). \(\xi_1,\ldots,\xi_m\)Змінні незалежні, однакові чі-квадрат, розподілені з двома ступенями свободи.
Результат цієї пропозиції може бути використаний для побудови довірчих інтервалів для значення спектральної густини на частоті\(\omega\). З цією метою позначимо\(\chi_2^2(\alpha)\) нижнім хвостом ймовірність хи-квадратної змінної\(\xi_j\), тобто
\[ P(\xi_j\leq\chi_2^2(\alpha))=\alpha. \nonumber \]
Тоді пропозиція 4.3.2. має на увазі, що приблизний довірчий інтервал з рівнем\(1-\alpha\) задається
\[ \frac{2I(\omega_{j:n})}{\chi_2^2(1-\alpha/2)}\leq f(\omega)\leq \frac{2I(\omega_{j:n})}{\chi_2^2(\alpha/2)}. \nonumber \]
Пропозиція 4.3.2. також передбачає, що довірчі інтервали можуть бути виведені одночасно для декількох частотних компонентів. Перш ніж обчислюються довірчі інтервали для домінуючої частоти набору даних повернення на мить до обчислення БПФ, що є основою для використання періодограми. Щоб забезпечити швидкий час обчислення, слід використовувати високоскладові цілі числа\(n^\prime\). Щоб досягти цього загалом, тривалість часових рядів регулюється шляхом заповнення вихідних, але визначених даних шляхом додавання нулів. У R спектральний аналіз виконується за допомогою функції spec.pgram. Щоб дізнатися, який $n^\ prime$ використовується для ваших конкретних даних, введіть nextn (length (x)), припускаючи, що ваш ряд знаходиться в x.
Приклад 4.3.1.
На малюнку 4.5 відображається періодограма даних набору, яка була розглянута в прикладі 3.3.5. Він показує сильну річну частотну складову, а\(\omega=1/12\) також кілька шипів в районі частоти El Ni\(\tilde{n}\) o\(\omega=1/48\). Більш високі частотні компоненти при\(\omega>.3\) цьому практично відсутні. Незважаючи на те, що модель AR (2) була пристосована до цих даних у розділі 3 для отримання майбутніх значень на основі цього пристосування, видно, що періодограма тут не підтверджує це пристосування, оскільки спектральна щільність процесу AR (2) (як обчислено в прикладі 4.2.3.) якісно відрізняється. У R можуть бути використані наступні команди (nextn (length (rec)) дає\(n^\prime=480\) тут, якщо дані набору зберігаються в rec, як і раніше).
> rec.pgram = spec.pgram (рек, конус = 0, журнал = «ні»)
> аблайн (v=1/12, lty = 2)
> аблайн (v=1/48, lty = 2)
Функція spec.pgram дозволяє точно налаштувати спектральний аналіз. Для наших цілей ми завжди використовуємо наведені вище специфікації для сирої періодограми (конусність дозволяє, наприклад, виключно дивитися на ту чи іншу смугу частот, журнал дозволяє побудувати лог-періодограму і є стандартом R).
Для обчислення довірчих інтервалів для двох домінуючих частот\(1/12\) і\(1/48\), можна використовувати наступний код R, зазначивши, що\(1/12=40/480\) і\(1/48=10/480\).
>рек.пграм {\ $} специфікація [40]
[1] 21332.94
>рек.пграм {\ $} специфікація [10]
[1] 14368.42
>u = qchisq (.025, 2); л = qchisq (.975, 2)
>2*рек.грам {\ $} специфікація [40] /л
> 2*рек.грам {\ $} специфікація [40] /u
>2*рек.грам {\ $} специфікація [10] /л
~2*рек.грам {\ $} специфікація [10] /u
Використовуючи числові значення цього аналізу, отримують наступні довірчі інтервали на рівні\(\alpha=.1\):
\[ f(1/12)\in(5783.041,842606.2)\qquad\mbox{and}\qquad f(1/48)\in(3895.065, 567522.5). \nonumber \]
Вони занадто широкі, і потрібні альтернативи сирої періодограми. Вони забезпечуються, наприклад, підходом згладжування, який використовує процедуру усереднення по смузі сусідніх частот. Зробити це можна наступним чином.
>k=ядро («Даніель» ,4)
> rec.ave=spec.pgram (рек, к, конус = 0, журнал = «ні»)
> аблайн (v=1/12, lty = 2)
> аблайн (v=1/48, lty = 2)
> Rec.ave $ пропускна здатність
[1] 0.005412659\ медскіп
Отримана згладжена періодограма показана на малюнку 4.6. Це менш шумно, як очікується від прийняття середніх показників. Точніше, тут\(m=4\) використовувався двосторонній фільтр Даніеля з\(L=2m+1\) сусідніми частотами.
\[ \omega_k=\omega_j+\frac kn,\qquad k=-m,\ldots,m, \nonumber \]
обчислити періодограму в\(\omega_j=j/n\). Отриманий графік на малюнку 4.6 показує, з іншого боку, що різкий річний пік був значно сплющений. Пропускну здатність, повідомлену в R, можна обчислити як\(b=L/(\sqrt{12}n)\). Для обчислення довірчих інтервалів потрібно коригувати раніше отриману формулу. Це робиться шляхом прийняття зміни ступенів свободи від 2 до\(df=2Ln/n^\prime\) (якщо нулі куди додаються) і призводить до
\[ \frac{df}{\chi^2_{df}(1-\alpha/2)} \sum_{k=-m}^mf(\omega_j+\frac kn) \leq f(\omega) \leq \frac{df}{\chi^2_{df}(\alpha/2)}\sum_{k=-m}^mf(\omega_j+\frac kn) \nonumber \]
для\(\omega\approx\omega_j\). Для даних набору можна використовувати наступний код R:
>дф = стеля (рет.ave {\ $} дф)
>u = qchisq (.025, дф), л ~ ~ qchisq (.975, дф)
>df*rec.ave {\ $} специфікація [40] /л
>df*rec.ave {\ $} специфікація [40] /u
>df*rec.ave {\ $} специфікація [10] /л
>df*rec.ave {\ $} специфікація [10] /u
щоб отримати довірчі інтервали
\[ f(1/12)\in(1482.427, 5916.823)\qquad\mbox{and}\qquad f(1/48)\in(4452.583, 17771.64). \nonumber \]
Компроміс між галасливою сирої періодограмою та подальшим згладжуванням, як описано тут (з\(L=9\)), змінює величину\(1/12\) річної частоти та компонента\(1/48\) El Ni\(\tilde{n}\) o. Це пов'язано з тим, що річний пік дуже різкий, причому сусідні частоти в основному дорівнюють нулю. Для\(1/48\) компонента існує ціла смуга сусідньої частоти, яка також сприяє явищу El Ni\(\tilde{n}\) o нерегулярне і лише в середньому з'являється кожні чотири роки). Більш того, річний цикл тепер розподілений по цілому діапазону. Один із способів вирішення цієї проблеми забезпечується використанням інших ядер, таких як модифіковане ядро Daniell, наведене в R як ядро («modified.daniell», c (3,3)). Це призводить до спектральної щільності на малюнку 4.7.
Дописувачі
Демо: Мені дуже подобається те, як\(\ref{Eq1}\) виглядає рівняння.
