8.3 Modèles autorégressifs
Dans un modèle de régression multiple, nous prévoyons la variable d’intérêt en utilisant une combinaison linéaire de prédicteurs. Dans un modèle autorégressif, nous prévoyons la variable d’intérêt en utilisant une combinaison linéaire des valeurs passées de la variable. Le terme autorégression indique qu’il s’agit d’une régression de la variable contre elle-même.
Ainsi, un modèle autorégressif d’ordre \(p\) peut s’écrire comme\où \(\varepsilon_t\) est un bruit blanc. C’est comme une régression multiple mais avec des valeurs retardées de \(y_t\) comme prédicteurs. Nous appelons cela un modèle AR(\(p\)), un modèle autorégressif d’ordre \(p\).
Les modèles autorégressifs sont remarquablement flexibles pour traiter un large éventail de modèles de séries chronologiques différents. Les deux séries de la figure 8.5 montrent des séries issues d’un modèle AR(1) et d’un modèle AR(2). La modification des paramètres \(\phi_1, \dots, \phi_p\) donne lieu à différents modèles de séries chronologiques. La variance du terme d’erreur \(\varepsilon_t\) ne changera que l’échelle de la série, pas les modèles.
Figure 8.5 : Deux exemples de données issues de modèles autorégressifs avec différents paramètres. À gauche : AR(1) avec \(y_t = 18 -0,8y_{t-1} + \varepsilon_t\). A droite : AR(2) avec \(y_t = 8 + 1,3y_{t-1}-0,7y_{t-2}+\varepsilon_t\). Dans les deux cas, \(\varepsilon_t\) est un bruit blanc normalement distribué de moyenne zéro et de variance un.
Pour un modèle AR(1) :
- lorsque \(\phi_1=0\), \(y_t\) est équivalent à un bruit blanc;
- lorsque \(\phi_1=1\) et \(c=0\), \(y_t\) est équivalent à une marche aléatoire ;
- lorsque \(\phi_1=1\) et \(c=0\), \(y_t\) est équivalent à une marche aléatoire avec dérive;
- lorsque \(\phi_1<0\), \(y_t\) tend à osciller autour de la moyenne.
Nous limitons normalement les modèles autorégressifs aux données stationnaires, auquel cas certaines contraintes sur les valeurs des paramètres sont nécessaires.
- Pour un modèle AR(1) : \(-1 < \phi_1 < 1\).
- Pour un modèle AR(2) : \(-1 < \phi_2 < 1\), \(\phi_1+\phi_2 < 1\), \(\phi_2-\phi_1 < 1\).
Lorsque \(p\ge3\), les restrictions sont beaucoup plus compliquées. R prend en charge ces restrictions lors de l’estimation d’un modèle.