Un panel tiene la forma
X i t , i = 1 , … , N , t = 1 , … , T , {\displaystyle X_{it},\quad i=1,\dots ,N,\quad t=1,\dots ,T,}
donde i {\displaystyle i}
es la dimensión individual y t {\displaystyle t}
es la dimensión temporal. Un modelo de regresión de datos de panel general se escribe como y i t = α + β ′ X i t + u i t . {\displaystyle y_{it}=\alpha +\beta ‘X_{it}+u_{it}.}
Se pueden hacer diferentes supuestos sobre la estructura precisa de este modelo general. Dos modelos importantes son el modelo de efectos fijos y el modelo de efectos aleatorios.
Consideremos un modelo genérico de datos de panel:
y i t = α + β ′ X i t + u i t , {\displaystyle y_{it}=\alpha +\beta ‘X_{it}+u_{it},}
u i t = μ i + v i t . {\displaystyle u_{it}=\mu _{i}+v_{it}.}
μ i {\displaystyle \mu _{i}}
son efectos específicos del individuo e invariables en el tiempo (por ejemplo, en un panel de países podría incluir la geografía, el clima, etc.) que se fijan a lo largo del tiempo., mientras que v i t {\displaystyle v_{it}}
es un componente aleatorio que varía con el tiempo.
Si μ i {\displaystyle \mu _{i}}
es inobservable, y está correlacionada con al menos una de las variables independientes, entonces causará un sesgo de variable omitida en una regresión OLS estándar. Sin embargo, los métodos de datos de panel, como el estimador de efectos fijos o, alternativamente, el estimador de primera diferencia, pueden utilizarse para controlarlo.
Si μ i {\displaystyle \mu _{i}}
no está correlacionada con ninguna de las variables independientes, se pueden utilizar métodos de regresión lineal por mínimos cuadrados ordinarios para obtener estimaciones insesgadas y consistentes de los parámetros de regresión. Sin embargo, debido a que μ i {\displaystyle \mu _{i}}
es fija a lo largo del tiempo, inducirá una correlación serial en el término de error de la regresión. Esto significa que existen técnicas de estimación más eficientes. Los efectos aleatorios son uno de esos métodos: es un caso especial de mínimos cuadrados generalizados factibles que controla la estructura de la correlación serial inducida por μ i {\displaystyle \mu _{i}}.
.
Datos de panel dinámicosEditar
Los datos de panel dinámicos describen el caso en el que se utiliza un retardo de la variable dependiente como regresor:
y i t = α + β ′ X i t + γ y i t – 1 + u i t , {\displaystyle y_{it}=\alpha +\beta ‘X_{it}+\gamma y_{it-1}+u_{it},}
La presencia de la variable dependiente rezagada viola la exogeneidad estricta, es decir, puede haber endogeneidad. Tanto el estimador de efectos fijos como el de primeras diferencias se basan en el supuesto de exogeneidad estricta. Por lo tanto, si u i {displaystyle u_{i}}
se cree que está correlacionada con una de las variables independientes, debe utilizarse una técnica de estimación alternativa. En esta situación se suelen utilizar las técnicas de variables instrumentales o GMM, como el estimador de Arellano-Bond.