Een panel heeft de vorm
X i t , i = 1 , … , N , t = 1 , … , T , {\displaystyle X_{it},\quad i=1,\dots,N,\quad t=1,\dots,T,}
waarin i {\displaystyle i}
de individuele dimensie is en t {\displaystyle t}
de tijdsdimensie is. Een algemeen paneldata-regressiemodel wordt geschreven als y i t = α + β ′ X i t + u i t . {displaystyle y_{it}=alpha + bèta ‘X_{it}+u_{it}.}
Er kunnen verschillende veronderstellingen worden gemaakt over de precieze structuur van dit algemene model. Twee belangrijke modellen zijn het model met vaste effecten en het model met willekeurige effecten.
Beschouw een algemeen paneldatamodel:
y i t = α + β ′ X i t + u i t , {\displaystyle y_{it}=’X_{it}+u_{it},}
u i t = μ i + v i t . {displaystyle u_{it}=mu _{i}+v_{it}.}
μ i {\displaystyle \mu _{i}}
zijn individu-specifieke, tijd-invariante effecten (bijvoorbeeld in een panel van landen kunnen dit geografie, klimaat enz. zijn) die in de loop van de tijd worden vastgesteld, terwijl v i t {\displaystyle v_{it}}
een tijdafhankelijke toevalscomponent is.
Als μ i {\displaystyle \mu _{i}}
niet wordt waargenomen en gecorreleerd is met ten minste een van de onafhankelijke variabelen, dan zal dit in een standaard OLS-regressie leiden tot een vertekening door weglating van variabelen. Paneldatamethoden, zoals de vaste-effectenschatter of de eerste-verschillenschatter, kunnen echter worden gebruikt om dit te controleren.
Als μ i {{i}}
niet gecorreleerd is met een van de onafhankelijke variabelen, kunnen lineaire regressiemethoden met gewone kleinste kwadraten worden gebruikt om onvertekende en consistente schattingen van de regressieparameters op te leveren. Omdat μ i {{i}}
in de tijd vastligt, zal dit leiden tot seriële correlatie in de foutterm van de regressie. Dit betekent dat er efficiëntere schattingstechnieken beschikbaar zijn. Random effects is zo’n methode: het is een speciaal geval van haalbare gegeneraliseerde kleinste kwadraten die controleert voor de structuur van de seriële correlatie die wordt geïnduceerd door μ i {displaystyle \mu _{i}}
.
Dynamische paneldataEdit
Dynamische paneldata beschrijft het geval waarin een vertraging van de afhankelijke variabele als regressor wordt gebruikt:
y i t = α + β ′ X i t + γ y i t – 1 + u i t , {\displaystyle y_{it}=’X_{it}+’gamma y_{it-1}+u_{it},}
De aanwezigheid van de vertraagde afhankelijke variabele is in strijd met strikte exogeniteit, dat wil zeggen dat er endogeniteit kan optreden. De schatter met een vast effect en de schatter met eerste verschillen berusten beide op de aanname van strikte exogeniteit. Dit betekent dat als u i {{i}}
wordt verondersteld gecorreleerd te zijn met een van de onafhankelijke variabelen, moet een alternatieve ramingstechniek worden gebruikt. Instrumentele variabelen of GMM-technieken worden in deze situatie vaak gebruikt, zoals de Arellano-Bond-schatter.