8.3 Autoregresní modely
V modelu vícenásobné regrese předpovídáme proměnnou, která nás zajímá, pomocí lineární kombinace prediktorů. V autoregresním modelu předpovídáme proměnnou, která nás zajímá, pomocí lineární kombinace minulých hodnot proměnné. Termín autoregrese naznačuje, že se jedná o regresi proměnné proti sobě samé.
Autoregresní model řádu \(p\) lze tedy zapsat takto\ kde \(\varepsilon_t\) je bílý šum. Je to jako vícenásobná regrese, ale se zpožděnými hodnotami \(y_t\) jako prediktory. Označujeme to jako model AR(\(p\)), autoregresní model řádu \(p\).
Autoregresní modely jsou pozoruhodně flexibilní při zpracování široké škály různých časových řad. Dvě řady na obrázku 8.5 ukazují řady z modelu AR(1) a modelu AR(2). Změna parametrů \(\phi_1,\dots,\phi_p\) vede k různým vzorům časových řad. Rozptyl chybového členu \(\varepsilon_t\) změní pouze měřítko řady, nikoli její vzorce.
Obrázek 8.5: Dva příklady dat z autoregresních modelů s různými parametry. Vlevo: AR(1) s \(y_t = 18 -0,8y_{t-1} + \varepsilon_t\). Vpravo: AR(2) s \(y_t = 8 + 1,3y_{t-1}-0,7y_{t-2}+\varepsilon_t\). V obou případech je \(\varepsilon_t\) normálně rozdělený bílý šum se střední hodnotou nula a rozptylem jedna.
Pro model AR(1):
- když \(\phi_1=0\), \(y_t\) je ekvivalentní bílému šumu;
- když \(\phi_1=1\) a \(c=0\), \(y_t\) je ekvivalentní náhodné procházce;
- když \(\phi_1=1\) a \(c\ne0\), \(y_t\) je ekvivalentní náhodné procházce s driftem;
- když \(\phi_1<0\), \(y_t\) má tendenci oscilovat kolem střední hodnoty.
Obvykle omezujeme autoregresní modely na stacionární data, v takovém případě jsou vyžadována určitá omezení hodnot parametrů.
- Pro model AR(1):
- Pro AR(2) model: \(-1 < \phi_1 < 1\): Při \(-1 < \phi_2 < 1\), \(\phi_1+\phi_2 < 1\), \(\phi_2-\phi_1 < 1\).
Při \(p\ge3\) jsou omezení mnohem složitější. R se o tato omezení postará při odhadu modelu.