8.3 Autoregressive Modelle
Bei einem multiplen Regressionsmodell wird die interessierende Variable anhand einer linearen Kombination von Prädiktoren vorhergesagt. Bei einem Autoregressionsmodell wird die interessierende Variable anhand einer Linearkombination vergangener Werte der Variable vorhergesagt. Der Begriff Autoregression weist darauf hin, dass es sich um eine Regression der Variable gegen sich selbst handelt.
Ein autoregressives Modell der Ordnung \(p\) kann also wie folgt geschrieben werden: \(\varepsilon_t\) ist weißes Rauschen. Dies ist wie eine multiple Regression, jedoch mit verzögerten Werten von \(y_t\) als Prädiktoren. Wir bezeichnen dies als AR(\(p\))-Modell, ein autoregressives Modell der Ordnung \(p\).
Autoregressive Modelle sind bemerkenswert flexibel bei der Handhabung eines breiten Spektrums unterschiedlicher Zeitreihenmuster. Die beiden Reihen in Abbildung 8.5 zeigen Reihen aus einem AR(1)-Modell und einem AR(2)-Modell. Die Änderung der Parameter \(\phi_1,\dots,\phi_p\) führt zu unterschiedlichen Zeitreihenmustern. Die Varianz des Fehlerterms \(\varepsilon_t\) verändert nur die Skala der Reihe, nicht aber die Muster.
Abbildung 8.5: Zwei Beispiele von Daten aus autoregressiven Modellen mit unterschiedlichen Parametern. Links: AR(1) mit \(y_t = 18 -0.8y_{t-1} + \varepsilon_t\). Rechts: AR(2) mit \(y_t = 8 + 1.3y_{t-1}-0.7y_{t-2}+\varepsilon_t\). In beiden Fällen ist \(\varepsilon_t\) normalverteiltes weißes Rauschen mit Mittelwert Null und Varianz Eins.
Für ein AR(1)-Modell:
- wenn \(\phi_1=0\), ist \(y_t\) äquivalent zu weißem Rauschen;
- wenn \(\phi_1=1\) und \(c=0\), ist \(y_t\) äquivalent zu einem random walk;
- wenn \(\phi_1=1\) und \(c=0\), ist \(y_t\) äquivalent zu einem Random Walk mit Drift;
- wenn \(\phi_1<0\), neigt \(y_t\) dazu, um den Mittelwert zu schwingen.
In der Regel beschränken wir autoregressive Modelle auf stationäre Daten, in diesem Fall sind einige Beschränkungen für die Werte der Parameter erforderlich.
- Für ein AR(1)-Modell: \(-1 < \phi_1 < 1\).
- Für ein AR(2)-Modell: \(-1 < \phi_2 < 1\), \(\phi_1+\phi_2 < 1\), \(\phi_2-\phi_1 < 1\).
Wenn \(p\ge3\), sind die Einschränkungen viel komplizierter. R kümmert sich um diese Einschränkungen, wenn ein Modell geschätzt wird.