Regresja Poissona może być odpowiednia, gdy zmienną zależną jest liczba, na przykład zdarzeń, takich jak przybycie rozmowy telefonicznej do centrum obsługi telefonicznej. Zdarzenia muszą być niezależne w tym sensie, że przybycie jednego połączenia nie uczyni innego bardziej lub mniej prawdopodobnym, ale prawdopodobieństwo na jednostkę czasu zdarzeń jest rozumiane jako związane ze zmiennymi współrzędnymi, takimi jak pora dnia.

„Ekspozycja” i offsetEdit

Regresja Poissona może być również odpowiednia dla danych dotyczących wskaźnika, gdzie wskaźnik jest liczbą zdarzeń podzieloną przez pewną miarę ekspozycji tej jednostki (konkretna jednostka obserwacji). Na przykład, biolodzy mogą liczyć liczbę gatunków drzew w lesie: zdarzeniami byłyby obserwacje drzew, ekspozycja byłaby jednostką powierzchni, a tempo byłoby liczbą gatunków na jednostkę powierzchni. Demografowie mogą modelować współczynniki zgonów w obszarach geograficznych jako liczbę zgonów podzieloną przez osobolat. Bardziej ogólnie, wskaźniki zdarzeń mogą być obliczane jako zdarzenia na jednostkę czasu, co pozwala na zróżnicowanie okna obserwacji dla każdej jednostki. W tych przykładach narażenie jest odpowiednio jednostką obszaru, osobolat i jednostką czasu. W regresji Poissona jest to traktowane jako przesunięcie, gdzie zmienna narażenia wchodzi po prawej stronie równania, ale z oszacowaniem parametru (dla log(narażenie)) ograniczonym do 1.

log ( E ( Y ∣ x ) = log ( narażenie ) + θ ′ x { {displaystyle \ log(\operatorname {E} (Y ∣ x))= log({text{exposure}})+ θ 'x}

co implikuje

log ( E ( Y ∣ x ) ) – log ( ekspozycja ) = log ( E ( Y ∣ x ) ekspozycja ) = θ ′ x {displaystyle \ log(\operatorname {E} (Ymid x))-log({text{exposure}})=log ̇left({frac {operatorname {E} (Ymid x)}{text{exposure}} right)=theta 'x}.

Offset w przypadku GLM w R można uzyskać za pomocą funkcji offset():

glm(y ~ offset(log(exposure)) + x, family=poisson(link=log) )

Nadmierna dyspersja i zerowa inflacjaEdit

Charakterystyką rozkładu Poissona jest to, że jego średnia jest równa wariancji. W pewnych okolicznościach okaże się, że obserwowana wariancja jest większa niż średnia; jest to znane jako nadmierne rozproszenie i wskazuje, że model nie jest odpowiedni. Częstym powodem jest pominięcie istotnych zmiennych objaśniających lub obserwacji zależnych. W pewnych okolicznościach problem nadmiernej dyspersji można rozwiązać, stosując zamiast tego estymację quasi-prawdopodobieństwa lub ujemny rozkład dwumianowy.

Ver Hoef i Boveng opisali różnicę między quasi-poissonem (zwanym również nadmierną dyspersją z quasi-prawdopodobieństwem) a ujemnym dwumianem (odpowiednikiem gamma-Poissona) w następujący sposób: Jeżeli E(Y) = μ, to model quasi-Poisson zakłada var(Y) = θμ, natomiast gamma-Poisson zakłada var(Y) = μ(1 + κμ), gdzie θ jest parametrem naddyspersji quasi-Poissona, a κ jest parametrem kształtu rozkładu dwumianowego ujemnego. W przypadku obu modeli parametry są szacowane przy użyciu iteracyjnie ważonych najmniejszych kwadratów. W przypadku quasi-poissona wagi wynoszą μ/θ. Dla ujemnego rozkładu dwumianowego wagi wynoszą μ/(1 + κμ). Przy dużym μ i znacznej zmienności pozapojsonowskiej wagi ujemnego dwumianu są ograniczone do 1/κ. Ver Hoef i Boveng omówili przykład, w którym dokonali wyboru między tymi dwoma rozwiązaniami, wykreślając średnie kwadraty reszt względem średniej.

Innym powszechnym problemem z regresją Poissona jest nadmiar zer: jeśli w pracy występują dwa procesy, jeden określający, czy występuje zero zdarzeń czy jakiekolwiek zdarzenia, oraz proces Poissona określający, ile jest zdarzeń, będzie więcej zer niż przewidywałaby regresja Poissona. Przykładem może być dystrybucja papierosów wypalonych w ciągu godziny przez członków grupy, w której niektóre osoby są niepalące.

Inne uogólnione modele liniowe, takie jak model dwumianowy ujemny lub model z wypełnieniem zerowym, mogą działać lepiej w tych przypadkach.

Zastosowanie w analizie przeżyciaEdit

Regresja Poissona tworzy modele zagrożeń proporcjonalnych, jedną z klas analizy przeżycia: zobacz modele zagrożeń proporcjonalnych dla opisów modeli Coxa.

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.