4.3: Великі властивості зразка
(Xt:t∈Z)Дозволяти бути слабо стаціонарний часовий ряд ізμ середньою, абсолютно сумованою ACVFγ(h) і спектральною щільністюf(ω). Продовжуючи, як у доведенні Пропозиції4.2.2., отримується
I(ωj)=1nn−1∑h=−n+1n−|h|∑t=1(Xt+|h|−μ)(Xt−μ)exp(−2πiωjh),
за умовиωj≠0. Використовуючи це уявлення, можна встановити граничну поведінку періодограми.
Пропозиція 4.3.1
НехайI(⋅) буде періодограма, заснована на спостереженняхX1,…,Xn слабо стаціонарного процесу(Xt:t∈Z), то, для будь-якогоω≠0,
E[I(ωj:n)]→f(ω)(n→∞),
деωj:n=jn/n з(jn)n∈N обраний такий, щоωj:n→ω якn→∞. Якщоω=0, то
E[I(0)]−nμ2→f(0)(n→∞).
Доказ. Існують два обмеження, що беруть участь в обчисленнях середнє значення періодограми. Спочатку візьміть ліміт якn→∞. Це, однак, вимагає, по-друге, щоб для кожногоn нам довелося працювати з різним набором частот Фур'є. Щоб підлаштуватися під це, ми ввели позначенняωj:n. Якщоωj≠0 частота Фур'є (nфіксована!) , потім
E[I(ωj)]=n−1∑h=−n+1(n−|h|n)γ(h)exp(−2πiωjh).
Тому (n→∞!) ,
E[I(ωj:n)]→∞∑h=−∞γ(h)exp(−2πiωh)=f(ω),
доводячи тим самим першу претензію. Другий випливає зI(0)=nˉX2n (див. Пропозиція 4.2.2.), так,E[I(0)]−nμ2=n(E[ˉX2n]−μ2)=nVar(ˉXn)→f(0)n→∞ як у главі 2. Доказ повний.
Пропозиція 4.3.1. показує, щоI(ω) періодограма асимптотично неупереджена дляf(ω). Це, однак, непослідовно. Це мається на увазі наступна пропозиція, яка дається без доказів. Не дивно, враховуючи, що кожне значенняI(ωj) є сумою квадратів лише двох випадкових величин незалежно від розміру вибірки.
Пропозиція 4.3.2.
Якщо(Xt:t∈Z) є (причинний або непричинний) слабо стаціонарний часовий ряд такий, що
Xt=∞∑j=−∞ψjZt−j,t∈Z,
з∑∞j=−∞|ψj|<∞and(Zt)t∈Z∼WN(0,σ2), потім
(2I(ω1:n)f(ω1),…,2I(ωm:n)f(ωm))D→(ξ1,…,ξm),
деω1,…,ωmm різніωj:n→ωj частоти з іf(ωj)>0. ξ1,…,ξmЗмінні незалежні, однакові чі-квадрат, розподілені з двома ступенями свободи.
Результат цієї пропозиції може бути використаний для побудови довірчих інтервалів для значення спектральної густини на частотіω. З цією метою позначимоχ22(α) нижнім хвостом ймовірність хи-квадратної змінноїξj, тобто
P(ξj≤χ22(α))=α.
Тоді пропозиція 4.3.2. має на увазі, що приблизний довірчий інтервал з рівнем1−α задається
2I(ωj:n)χ22(1−α/2)≤f(ω)≤2I(ωj:n)χ22(α/2).
Пропозиція 4.3.2. також передбачає, що довірчі інтервали можуть бути виведені одночасно для декількох частотних компонентів. Перш ніж обчислюються довірчі інтервали для домінуючої частоти набору даних повернення на мить до обчислення БПФ, що є основою для використання періодограми. Щоб забезпечити швидкий час обчислення, слід використовувати високоскладові цілі числаn′. Щоб досягти цього загалом, тривалість часових рядів регулюється шляхом заповнення вихідних, але визначених даних шляхом додавання нулів. У R спектральний аналіз виконується за допомогою функції spec.pgram. Щоб дізнатися, який $n^\ prime$ використовується для ваших конкретних даних, введіть nextn (length (x)), припускаючи, що ваш ряд знаходиться в x.
Приклад 4.3.1.
На малюнку 4.5 відображається періодограма даних набору, яка була розглянута в прикладі 3.3.5. Він показує сильну річну частотну складову, аω=1/12 також кілька шипів в районі частоти El Ni˜n oω=1/48. Більш високі частотні компоненти приω>.3 цьому практично відсутні. Незважаючи на те, що модель AR (2) була пристосована до цих даних у розділі 3 для отримання майбутніх значень на основі цього пристосування, видно, що періодограма тут не підтверджує це пристосування, оскільки спектральна щільність процесу AR (2) (як обчислено в прикладі 4.2.3.) якісно відрізняється. У R можуть бути використані наступні команди (nextn (length (rec)) даєn′=480 тут, якщо дані набору зберігаються в rec, як і раніше).
> rec.pgram = spec.pgram (рек, конус = 0, журнал = «ні»)
> аблайн (v=1/12, lty = 2)
> аблайн (v=1/48, lty = 2)
Функція spec.pgram дозволяє точно налаштувати спектральний аналіз. Для наших цілей ми завжди використовуємо наведені вище специфікації для сирої періодограми (конусність дозволяє, наприклад, виключно дивитися на ту чи іншу смугу частот, журнал дозволяє побудувати лог-періодограму і є стандартом R).
Для обчислення довірчих інтервалів для двох домінуючих частот1/12 і1/48, можна використовувати наступний код R, зазначивши, що1/12=40/480 і1/48=10/480.
>рек.пграм {\ $} специфікація [40]
[1] 21332.94
>рек.пграм {\ $} специфікація [10]
[1] 14368.42
>u = qchisq (.025, 2); л = qchisq (.975, 2)
>2*рек.грам {\ $} специфікація [40] /л
> 2*рек.грам {\ $} специфікація [40] /u
>2*рек.грам {\ $} специфікація [10] /л
~2*рек.грам {\ $} специфікація [10] /u
Використовуючи числові значення цього аналізу, отримують наступні довірчі інтервали на рівніα=.1:
f(1/12)∈(5783.041,842606.2)andf(1/48)∈(3895.065,567522.5).
Вони занадто широкі, і потрібні альтернативи сирої періодограми. Вони забезпечуються, наприклад, підходом згладжування, який використовує процедуру усереднення по смузі сусідніх частот. Зробити це можна наступним чином.
>k=ядро («Даніель» ,4)
> rec.ave=spec.pgram (рек, к, конус = 0, журнал = «ні»)
> аблайн (v=1/12, lty = 2)
> аблайн (v=1/48, lty = 2)
> Rec.ave $ пропускна здатність
[1] 0.005412659\ медскіп
Отримана згладжена періодограма показана на малюнку 4.6. Це менш шумно, як очікується від прийняття середніх показників. Точніше, тутm=4 використовувався двосторонній фільтр Даніеля зL=2m+1 сусідніми частотами.
ωk=ωj+kn,k=−m,…,m,
обчислити періодограму вωj=j/n. Отриманий графік на малюнку 4.6 показує, з іншого боку, що різкий річний пік був значно сплющений. Пропускну здатність, повідомлену в R, можна обчислити якb=L/(√12n). Для обчислення довірчих інтервалів потрібно коригувати раніше отриману формулу. Це робиться шляхом прийняття зміни ступенів свободи від 2 доdf=2Ln/n′ (якщо нулі куди додаються) і призводить до
dfχ2df(1−α/2)m∑k=−mf(ωj+kn)≤f(ω)≤dfχ2df(α/2)m∑k=−mf(ωj+kn)
дляω≈ωj. Для даних набору можна використовувати наступний код R:
>дф = стеля (рет.ave {\ $} дф)
>u = qchisq (.025, дф), л ~ ~ qchisq (.975, дф)
>df*rec.ave {\ $} специфікація [40] /л
>df*rec.ave {\ $} специфікація [40] /u
>df*rec.ave {\ $} специфікація [10] /л
>df*rec.ave {\ $} специфікація [10] /u
щоб отримати довірчі інтервали
f(1/12)∈(1482.427,5916.823)andf(1/48)∈(4452.583,17771.64).
Компроміс між галасливою сирої періодограмою та подальшим згладжуванням, як описано тут (зL=9), змінює величину1/12 річної частоти та компонента1/48 El Ni˜n o. Це пов'язано з тим, що річний пік дуже різкий, причому сусідні частоти в основному дорівнюють нулю. Для1/48 компонента існує ціла смуга сусідньої частоти, яка також сприяє явищу El Ni˜n o нерегулярне і лише в середньому з'являється кожні чотири роки). Більш того, річний цикл тепер розподілений по цілому діапазону. Один із способів вирішення цієї проблеми забезпечується використанням інших ядер, таких як модифіковане ядро Daniell, наведене в R як ядро («modified.daniell», c (3,3)). Це призводить до спектральної щільності на малюнку 4.7.
Дописувачі
Демо: Мені дуже подобається те, як??? виглядає рівняння.