Skip to main content
LibreTexts - Ukrayinska

4.1: Вступ до спектрального аналізу

Багато часових рядів, обговорюваних у попередніх розділах, відображали сильні періодичні компоненти: номери сонячних плям Приклад 1.1.1, кількість захоплених рисі Прикладу 1.1.2 та австралійські дані про продаж вина Приклад 1.4.1. Часто існує очевидний вибір на періодd такої циклічної частини, як річна картина продажів вина. Враховуючиd, можна було б продовжити, видаляючи сезонні ефекти, як у розділі 1.4. У перших двох прикладах, однак, дещо складніше визначити точне значенняd. У цьому розділі обговорюється загальний метод для розгляду періодичних компонентів часового ряду. Щоб ускладнити справу, зазвичай трапляється, що в часовому ряду одночасно присутні кілька циклічних закономірностей. Як приклад нагадаємо дані південного індексу коливань (SOI), які демонструють як річну картину, так і так звану модель El Ni˜n o.

Функції синуса і косинуса є прототипами періодичних функцій. Вони будуть використані тут для опису циклічної поведінки в часових рядах. Перш ніж це зробити, цикл визначається як один повний період синуса або косинуса функції протягом часового інтервалу довжини2π. Визначте також частоту

ω=1d

як кількість циклів за спостереження, деd позначається період часового ряду (тобто кількість спостережень в циклі). Для щомісячних спостережень з річним періодом,d=12 а значить іω=1/12=0.083 циклами за спостереження. Тепер перегляньте процес

Xt=Rsin(2πωt+φ)

як введено в прикладі 1.2.2, використовуючи конвенціюλ=2πω. Щоб включити випадковість в цей процес, виберіть амплітудуR і фазу,φ щоб бути випадковими величинами. Еквівалентне представлення цього процесу дається

Xt=Acos(2πωt)+Bsin(2πωt),

зA=Rsin(φ) і,B=Rcos(φ) як правило, незалежні стандартні нормальні варіації. Потім,R2=A2+B2 єχ -квадрат випадкової величини з 2 ступенями свободи іφ=tan1(B/A) рівномірно розподіляється по(π,π]. Причому,R іφ є незалежними. Вибравши зараз значенняω однієї конкретної періодичності можна описати. Для розміщення більше одного, здається природним розглянути суміші цих періодичних серій з декількома частотами і амплітудами:

Xt=mj=1[Ajcos(2πωjt)+Bjsin(2πωjt)],tZ,

деA1,,Am іB1,,Bm є незалежними випадковими величинами з нульовим середнім іσ21,,σ2m дисперсіями, іω1,,ωm є різними частотами. Можна показати, що(Xt:tZ) є слабо стаціонарним процесом з лаг- ч ACVF

γ(h)=mj=1σ2jcos(2πωjh),hZ.

Останній результат дає, зокрема, щоγ(0)=σ21++σ2m. ДисперсіяXt - це, отже, сума дисперсій складових.

Приклад 4.1.1. Нехайm=2 і вибирайтеA1=B1=1,A2=B2=4 щоб бути постійним так само, якω1=1/12 і іω2=1/6. Це означає, що

Xt=X(1)t+X(2)t=[cos(2πt/12)+sin(2πt/12)]+[4cos(2πt/6)+4sin(2πt/6)]

це сума двох періодичних складових, з яких одна демонструє річний цикл, а інша - цикл на півроку. Для всіх задіяних процесів реалізаціїn=48 спостережень (дані за 4 роки) відображені на малюнку 4.1. Також показаний графік четвертого часового ряду, який міститьXt спотворений стандартним нормальним незалежним шумом,˜Xt. Відповідний код R такий:


> t = 1:
48> x1 = cos (2* пі* т/12) +гріх (2* пі* т/12)
> x2 = 4* cos (2* пі* т/6) +4* гріх (2* пі* т/6)
> х = х1+х2
> тильдекс = х+норма (48)

Зверніть увагу, що квадрат амплітудиX(1)t дорівнює12+12=2. Таким чином, максимальне іX(1)t мінімальне значення є±2. Аналогічно отримуємо і±32 для другого компонента.

Для статистика зараз важливо розробити інструменти для відновлення періодичності даних. Гілка статистики, що займається цією проблемою, називається спектральним аналізом. Стандартний метод в цій області заснований на періодограмі, яка введена зараз. Припустимо на той момент, що параметр частотиω1=1/12 в прикладі 4.1.1 відомий. Для отримання оцінокA1 іB1, можна спробувати запустити регресію за допомогою пояснювальних зміннихYt,1=cos(2πt/12) абоYt,2=sin(2πt/12) обчислити оцінювачі найменших квадратів

\ почати {вирівнювати*}
\ капелюх A_1=&\ dfrac {\ сума_ {t=1} ^nx_ty_ {t,1}} {\ сума {t=1} ^nY_ {t,1} ^2} =\ dfrac 2n\ sum_ {t=1} ^nx_t\ cos (2\ пі т/12),\\ [.2см]
\ капелюх B_1=&\ dfrac {\ сума_ {t=1} ^nx_ty_ {t,2}} {\ sum_ {t=1} ^nY_ {t,2} ^2} =\ dfrac 2n\ sum_ {t=1} ^nx_t\ sin (2\ пі т/12).
\ end {вирівнювати*}

Малюнок 4.1: Графіки часових рядів (X t (1)), (X t (2)), (X t) та˜Xt

Оскільки, в цілому, задіяні частоти не будуть відомі статистику до аналізу даних, вищесказане пропонує вибрати ряд потенційних\(\omega's, say j/n for j=1,,n/2 і запустити тривалу регресію форми

Xt=n/2j=0[Ajcos(2πjt/n)+Bjsin(2πjt/n)].

Це призводить до найменших квадратів оцінокˆAj іˆBj з яких слід вибирати «значущі». Зверніть увагу, що регресія в 4.1.1 є ідеальним, тому що існує стільки невідомих, скільки змінних! Зауважте також, що

P(j/n)=ˆA2j+ˆB2j

є по суті (аж до нормалізації) оцінювачем кореляції між часовим рядомXt і відповідною сумою періодичних косинусних і синусоїдних функцій на частотіj/n. Колекція всіхP(j/n)j=1,,n/2, називається масштабована періодограма. Його можна швидко обчислити за допомогою алгоритму, відомого як швидке перетворення Фур'є (БПФ), який, в свою чергу, заснований на дискретному перетворенні Фур'є (DFT)

d(j/n)=1nnt=1Xtexp(2πijt/n).

Частотиj/n називаються Фур'є або основними частотами. Так якexp(ix)=cos(x)isin(x) і|z|2=zˉz=(a+ib)(aib)=a2+b2 для будь-якого комплексного числа випливаєz=a+ib, що

I(j/n)=|d(j/n)|2=1n(nt=1Xtcos(2πjt/n))2+1n(nt=1Xtsin(2πjt/n))2.

КількістьI(j/n) позначається як періодограма. Відразу випливає, що періодограма і масштабована періодограма пов'язані через ідентичність4I(j/n)=nP(j/n).

Приклад 4.1.2. Використовуючи вирази та позначення Прикладу 4.1.1, періодограма та масштабована періодограма обчислюються в R наступним чином:

> t = 1:48
> l = abs (fft (x) /sqrt (48)) ^
2> P = 4*
I/48> f = 0:24
/48>ділянка (f, P [1:25] , тип = «л»)
> аблайн (v=1/12)
> аблайн (v=1/6)

Відповідну (масштабовану) періодограмму для(˜Xt) можна отримати аналогічним чином. Масштабовані періодограми показані на лівій і середній панелі малюнка 4.2. На правій панелі відображається масштабована періодограма іншої версії,(˜Xt) в якій стандартний нормальний шум був замінений звичайним шумом з дисперсією 9. З цих графіків видно, що періодичність шести місяців добре видно на графіках (див. Пунктирні вертикальні лінії при x=1/6. Менш виражений річний цикл (вертикальна лінія при x = 1/12 все ще видно на перших двох масштабованих періодограмах, але втрачається, якщо дисперсія шуму збільшується, як на правій графіці. Однак зауважте, що шкала y відрізняється для всіх трьох графіків.

Малюнок 4.2: Масштабовані періодограми (Xt),(˜X(1)t),(˜X(2)t)

В ідеальній ситуації, коли ми спостерігаємо періодичну складову без додаткового забруднення шумом, ми можемо, крім того, зрозуміти, чому періодограма може бути корисною для виявлення дисперсійного розкладання зверху. Ми показали в рядках, що передують Приклад 4.1.1, що квадратні амплітудиX(1)t іX(2)t складають 2 і 32 відповідно. Ці значення легко зчитуються з масштабованої періодограми на лівій панелі малюнка 4.2. Забруднення шумом змінює ці значення.

У наступному розділі встановлено, що підхід в часовій області (заснований на властивостях ACVF, тобто регресії за минулими значеннями часового ряду) та підхід частотної області (з використанням періодичного функціонального підходу через фундаментальні частоти, тобто регресія на синусоїдних і косинусних функціях) еквівалент. Деякі подробиці наведено про спектральну щільність (аналог популяції періодограми) і про властивості самої періодограми.

Автори та атрибуція