Panel ma postać
X i t , i = 1 , … , N , t = 1 , … , T , {{displaystyle X_{it},\quad i=1,\dots ,N,\quad t=1,\dots ,T,}
gdzie i {{displaystyle}
jest wymiarem indywidualnym, a t {displaystyle t}
jest wymiarem czasowym. Ogólny model regresji danych panelowych zapisuje się jako y i t = α + β ′ X i t + u i t . {displaystyle y_{it}=alpha +beta 'X_{it}+u_{it}.}
Można przyjąć różne założenia dotyczące dokładnej struktury tego ogólnego modelu. Dwa ważne modele to model efektów stałych i model efektów losowych.
Rozważmy generyczny model danych panelowych:
y i t = α + β ′ X i t + u i t , {displaystyle y_{it}= ′alpha + ′beta 'X_{it}+u_{it},}
u i t = μ i + v i t . {{displaystyle u_{it}= μ i +v_{it}},}
μ i {{displaystyle \u_{i}}
to specyficzne dla jednostki, niezmienne w czasie efekty (na przykład w panelu krajów może to być geografia, klimat itp.), które są stałe w czasie, podczas gdy v i t {{displaystyle v_{it}}
jest zmiennym w czasie składnikiem losowym.
Jeśli μ i {{displaystyle \u _{i}}
jest nieobserwowalny i skorelowany z co najmniej jedną ze zmiennych niezależnych, wówczas spowoduje błąd pominiętych zmiennych w standardowej regresji OLS. Jednakże metody danych panelowych, takie jak estymator stałych efektów lub alternatywnie, estymator pierwszej różnicy, mogą być użyte do kontroli.
Jeśli μ i {{displaystyle \u _{i}}
nie jest skorelowane z żadną ze zmiennych niezależnych, można zastosować zwykłe metody regresji liniowej najmniejszych kwadratów, aby uzyskać bezstronne i spójne oszacowania parametrów regresji. Jednakże, ponieważ μ i {{i}}
jest stałe w czasie, spowoduje to korelację seryjną w składniku błędu regresji. Oznacza to, że dostępne są bardziej efektywne techniki estymacji. Efekty losowe są jedną z takich metod: jest to specjalny przypadek wykonalnej uogólnionej metody najmniejszych kwadratów, która kontroluje strukturę korelacji seryjnej wywołanej przez μ i {{displaystyle \u _{i}}
.
Dynamiczne dane paneloweEdit
Dynamiczne dane panelowe opisują przypadek, w którym opóźnienie zmiennej zależnej jest używane jako regresor:
y i t = α + β ′ X i t + γ y i t – 1 + u i t , {{displaystyle y_{it}=alpha +beta 'X_{it}+gamma y_{it-1}+u_{it},}
Występowanie opóźnionej zmiennej zależnej narusza ścisłą egzogeniczność, czyli może wystąpić endogeniczność. Zarówno estymator efektu stałego, jak i estymator pierwszych różnic opierają się na założeniu ścisłej egzogeniczności. Stąd, jeśli u i {{i}}
uważa się, że jest skorelowane z jedną ze zmiennych niezależnych, należy zastosować alternatywną technikę estymacji. W tej sytuacji powszechnie stosuje się techniki zmiennych instrumentalnych lub GMM, takie jak estymator Arellano-Bond.