Un panel a la forme
X i t , i = 1 , … , N , t = 1 , … , T , {\displaystyle X_{it},\quad i=1,\dots ,N,\quad t=1,\dots ,T,}
où i {\displaystyle i}
est la dimension individuelle et t {\displaystyle t}
est la dimension temporelle. Un modèle général de régression des données de panel s’écrit comme suit : y i t = α + β ′ X i t + u i t . {\displaystyle y_{it}=\alpha +\beta ‘X_{it}+u_{it}.}
Différentes hypothèses peuvent être faites sur la structure précise de ce modèle général. Deux modèles importants sont le modèle à effets fixes et le modèle à effets aléatoires.
Considérons un modèle générique de données de panel :
y i t = α + β ′ X i t + u i t , {\displaystyle y_{it}=\alpha +\beta ‘X_{it}+u_{it},}
u i t = μ i + v i t . {\displaystyle u_{it}=\mu _{i}+v_{it}.}
μ i {\displaystyle \mu _{i}}
sont des effets spécifiques à l’individu, invariants dans le temps (par exemple dans un panel de pays, cela peut inclure la géographie, le climat, etc.) qui sont fixes dans le temps, tandis que v i t {\displaystyle v_{it}}.
est une composante aléatoire variant dans le temps.
Si μ i {\displaystyle \mu _{i}}
est inobservé, et corrélé avec au moins une des variables indépendantes, alors il provoquera un biais de variable omise dans une régression MCO standard. Cependant, les méthodes de données de panel, telles que l’estimateur à effets fixes ou, alternativement, l’estimateur en première différence, peuvent être utilisées pour le contrôler.
If μ i {\displaystyle \mu _{i}}
n’est corrélé avec aucune des variables indépendantes, les méthodes de régression linéaire des moindres carrés ordinaires peuvent être utilisées pour produire des estimations non biaisées et cohérentes des paramètres de régression. Cependant, parce que μ i {\displaystyle \mu _{i}}
est fixe dans le temps, il induira une corrélation sérielle dans le terme d’erreur de la régression. Il existe donc des techniques d’estimation plus efficaces. Les effets aléatoires sont l’une de ces méthodes : c’est un cas particulier des moindres carrés généralisés réalisables qui contrôle la structure de la corrélation sérielle induite par μ i {\displaystyle \mu _{i}}.
.
Données de panel dynamiquesEdit
Les données de panel dynamiques décrivent le cas où un retard de la variable dépendante est utilisé comme régresseur :
y i t = α + β ′ X i t + γ y i t – 1 + u i t , {\displaystyle y_{it}=\alpha +\beta ‘X_{it}+\gamma y_{it-1}+u_{it},}
La présence de la variable dépendante retardée viole l’exogénéité stricte, c’est-à-dire qu’il peut y avoir endogénéité. L’estimateur à effet fixe et l’estimateur des premières différences reposent tous deux sur l’hypothèse d’exogénéité stricte. Par conséquent, si u i {\displaystyle u_{i}}
est censé être corrélé avec l’une des variables indépendantes, une autre technique d’estimation doit être utilisée. Les variables instrumentales ou les techniques GMM sont couramment utilisées dans cette situation, comme l’estimateur Arellano-Bond.