8.3 Autoregressieve modellen
In een meervoudig regressiemodel voorspellen we de variabele van belang aan de hand van een lineaire combinatie van voorspellers. In een autoregressiemodel wordt de variabele voorspeld aan de hand van een lineaire combinatie van vroegere waarden van de variabele. De term autoregressie geeft aan dat het om een regressie van de variabele tegen zichzelf gaat.
Dus kan een autoregressiemodel van orde \(p\) worden geschreven als waar \(\varepsilon_t\) witte ruis is. Dit is als een meervoudige regressie maar met vertraagde waarden van \(y_t\) als voorspellers. We noemen dit een AR(p)-model, een autoregressief model van de orde \(p)
Autoregressieve modellen zijn opmerkelijk flexibel in het hanteren van een breed scala van verschillende tijdreekspatronen. De twee reeksen in figuur 8.5 tonen reeksen van een AR(1)-model en een AR(2)-model. Verandering van de parameters (\phi_1,\dots,\phi_p\) resulteert in verschillende tijdreekspatronen. De variantie van de foutterm \(\varepsilon_t\) zal alleen de schaal van de reeks veranderen, niet de patronen.
Figuur 8.5: Twee voorbeelden van gegevens van autoregressieve modellen met verschillende parameters. Links: AR(1) met \(y_t = 18 -0,8y_{t-1} + \varepsilon_t\). Rechts: AR(2) met \(y_t = 8 + 1,3y_{t-1}-0,7y_{t-2}+ \varepsilon_t\). In beide gevallen is (\varepsilon_t\) een normaal verdeelde witte ruis met een gemiddelde van nul en een variantie van één.
Voor een AR(1) model:
- wanneer \(\phi_1=0), is \(y_t) gelijk aan witte ruis;
- wanneer \(\phi_1=1) en \(c=0), is \(y_t) gelijk aan een willekeurige gang;
- wanneer \phi_1=1=1) en \(c=0), dan is \(y_t) gelijk aan een random walk met drift;
- wanneer \(\phi_1<0), dan heeft \(y_t) de neiging om rond het gemiddelde te schommelen.
Wij beperken autoregressieve modellen gewoonlijk tot stationaire gegevens, in welk geval enige beperkingen aan de waarden van de parameters nodig zijn.
- Voor een AR(1) model:
- Voor een AR(2) model: \(-1 < \phi_2 < 1), \(\phi_1+\phi_2 < 1), \(\phi_2-phi_1 < 1).
Wanneer \(p\ge3), zijn de beperkingen veel gecompliceerder. R zorgt voor deze beperkingen bij het schatten van een model.