1.5: Оцінка залишків
- Page ID
- 97249
У цьому підрозділі вводяться кілька тестів на відповідність для подальшого аналізу залишків, отриманих після усунення трендових та сезонних компонентів. Основна мета полягає в тому, щоб визначити, чи можна ці залишки розглядати як отримані з послідовності незалежних, однаково розподілених випадкових величин або якщо в даних є залежність. Протягом\(Y_1,\ldots,Y_n\) позначають залишки і\(y_1,\ldots,y_n\) типову реалізацію.
Метод 1 (Зразок ACF) У прикладі 1.2.4 видно, що для\(j\not=0\) оцінки\(\hat{\rho}(j)\) ACF асимптотично\(\rho(j)\) незалежні і нормально розподілені із середнім нулем та дисперсією, за умови\(n^{-1}\), що лежать в основі залишків незалежні і однаково розподілені з кінцевою дисперсією. Тому, будуючи зразок АКФ на певну кількість лагів, скажімо\(h\), очікується, що приблизно 95% цих значень знаходяться в межах\(\pm 1.96/\sqrt{n}\). Функція R acf допомагає виконати цей аналіз. (Див. Теорему 1.2.1)
Метод 2 (Тест Портманто) Тест Портманто заснований на тестовій статистиці
\[ Q=n\sum_{j=1}^h\hat{\rho}^2(j). \nonumber \]
Використовуючи той факт, що\(\sqrt{n}\hat{\rho}(j)\) змінні асимптотично стандартні нормальні, стає очевидним, що\(Q\) самі по собі можуть бути наближені з розподілом хі-квадрата, що володіє\(h\) ступенями свободи. Гіпотеза незалежних і однаково розподілених залишків відкидається на рівні\(\alpha\) if\(Q>\chi_{1-\alpha}^2(h)\), де\(\chi_{1-\alpha}^2(h)\)\(1-\alpha\) квантиль хи-квадратного розподілу зі\(h\) ступенями свободи. Кілька уточнень оригінального тесту Портманто були встановлені в літературі. Ми посилаємось тут лише на папери Ljung and Box (1978) та McLeod and Li (1983) для отримання додаткової інформації.
Метод 3 (Ранг тест) Цей тест дуже корисний для пошуку лінійних тенденцій. Позначте по
\[\Pi=\#\{(i,j):Y_i>Y_j,\,i>j,\,i=2,\ldots,n\} \nonumber \]
випадкове число пар,\((i,j)\) що задовольняють умовам\(Y_i>Y_j\) і\(i>j\). Є\({n \choose 2}=\frac 12n(n-1)\) пари\((i,j)\) такі, що\(i>j\). Якщо\(Y_1,\ldots,Y_n\) незалежні і однаково розподілені, то\(P(Y_i>Y_j)=1/2\) (припускаючи безперервний розподіл). Тепер випливає, що\(\mu_\Pi=E[\Pi]=\frac 14n(n-1)\) і, аналогічно,\(\sigma_\Pi^2=\mbox{Var}(\Pi)=\frac{1}{72}n(n-1)(2n+5)\). Більш того, для досить великих розмірів вибірки\(n\),\(\Pi\) має приблизний нормальний розподіл із середнім\(\mu_\Pi\) і дисперсійним значенням\(\sigma_\Pi^2\). Отже, гіпотеза незалежних, ідентично розподілених даних буде відхилена на рівні,\(\alpha\) якщо
\[P=\frac{|\Pi-\mu_\Pi|}{\sigma_\Pi}>z_{1-\alpha/2}, \nonumber \]
де\(z_{1-\alpha/2}\) позначає\(1-\alpha/2\) квантиль стандартного нормального розподілу.
Метод 4 (Тести на нормальність) Якщо є докази того, що дані генеруються гауссовими випадковими величинами, можна створити графік qq для перевірки нормальності. Він заснований на візуальному огляді даних. З цією метою позначимо\(Y_{(1)}<\ldots<Y_{(n)}\) за порядком статистику залишків,\(Y_1,\ldots,Y_n\) які зазвичай розподіляються з очікуваним значенням\(\mu\) і дисперсією\(\sigma^2\). Він стверджує, що
\ begin {рівняння}\ мітка {еква:1.5.1} E [Y_ {(j)}] =\ mu+\ сигма E [X_ {(j)}],\ tag {1.5.1}\ end {рівняння}
де\(X_{(1)}<\ldots<X_{(n)}\) - статистика порядку стандартного нормального розподілу. Графік qq визначається як графік пар\((E[X_{(1)}],Y_{(1)}),\ldots,(E[X_{(n)}],Y_{(n)})\). Відповідно до відображення (1.5.1), отриманий графік буде приблизно лінійним з квадратною кореляцією\(R^2\) точок, близькою до 1. Таким чином, припущення про нормальність буде відхилено\(R^2\), якщо воно «занадто» мало. Це загальне для\(E[X_{(j)}]\approx\Phi_j=\Phi^{-1}((j-.5)/n)\) наближення (\(\Phi\)будучи розподільною функцією стандартного нормального розподілу). Попереднє твердження робиться точним, дозволивши
\[R^2=\frac{\left[\sum_{j=1}^n(Y_{(j)}-\bar{Y})\Phi_j\right]^2}{\sum_{j=1}^n(Y_{(j)}-\bar{Y})^2\sum_{j=1}^n\Phi_j^2}, \nonumber \]
де\(\bar{Y}=\frac 1n(Y_1+\ldots+Y_n)\). Критичні значення для\(R^2\) таблиці і їх можна знайти, наприклад, у Шапіро та Франсія (1972). Відповідною функцією R є qqnorm.
