Regressionsanalys >Prediktionsintervall
Vad är ett prediktionsintervall?
Regressionsanalys används för att förutse framtida trender.
Ett prediktionsintervall är en typ av konfidensintervall (CI) som används med förutsägelser i regressionsanalys; det är ett intervall av värden som förutsäger värdet av en ny observation, baserat på din befintliga modell.
Prediktion och konfidensintervall förväxlas ofta med varandra. De är dock inte riktigt samma sak.
- Ett konfidensintervall är ett intervall av värden som är kopplat till en populationsparameter. Till exempel medelvärdet för en population.
- Ett prediktionsintervall är var du förväntar dig att ett framtida värde kommer att falla.
Ovissheterna med intervall
Som det mesta inom statistiken betyder det inte att du med säkerhet kan förutsäga var ett enskilt värde kommer att falla.
Konfidensintervall är alltid förknippade med en konfidensnivå, som representerar en grad av osäkerhet (data är slumpmässiga och därför är resultaten från statistiska analyser aldrig 100 % säkra).
Till exempel kan man säga att medellivslängden för ett batteri (med en konfidensnivå på 95 %) är 100 till 110 timmar. Detta säger dig att ett batteri kommer att ligga inom intervallet 100 till 110 timmar 95 % av tiden.
Prediktionsintervallet talar på samma sätt om var ett värde kommer att hamna i framtiden, givet tillräckligt många stickprov, en viss procentandel av tiden. Ett 95-procentigt prediktionsintervall på 100-110 timmar för den genomsnittliga livslängden för ett batteri talar om att framtida producerade batterier kommer att ligga inom det intervallet 95 procent av tiden. Det finns en chans på 5 % att ett batteri inte kommer att falla inom detta intervall.
När man använder det
Det är mycket vanligt att använda konfidensintervallet i stället för prediktionsintervallet, särskilt inom ekonometri. Du bör dock använda ett prediktionsintervall i stället för ett konfidensintervall om du vill ha korrekta resultat. Låt oss säga att du beräknar ett konfidensintervall för den genomsnittliga dagliga utgiften för ditt företag och finner att den ligger mellan 5 000 och 6 000 dollar. Det talar om för dig var medelvärdet förmodligen ligger. Om du använder detta CI för att göra ett prognosintervall får du ett mycket smalare intervall. Till exempel kan prediktionsintervallet vara 2 500 dollar till 7 500 dollar vid samma konfidensnivå. Om du använder konfidensintervallet är det mycket troligt att intervallet kommer att ha mer fel, vilket innebär att värdena kommer att falla utanför intervallet oftare än vad du förutspår.
Var försiktig när du tolkar förutsägelseintervall och koefficienter om du transformerar svarsvariabeln: lutningen kommer att betyda något annat och alla förutsägelser och konfidens-/förutsägelseintervall kommer att vara för det transformerade svaret (Morgan, 2014).
Hur man hittar ett prediktionsintervall
För hand är formeln:
Du kommer förmodligen inte att vilja använda formeln dock, eftersom de flesta statistiska programvaror kommer att inkludera prediktionsintervallet i utdata för regression. Titta efter det bredvid konfidensintervallet i utdata som 95% PI eller liknande formulering.
- SPSS: Följ instruktionerna på sidan 3 i denna PDF av Andy Chang från Youngstown State University.
- Minitab: Klicka på fliken ”Options” (alternativ) i dialogrutan Simple Regression (enkel regression) och markera sedan PI-alternativet.
——————————————————————————
Behöver du hjälp med en läxa eller en provfråga? Med Chegg Study kan du få steg-för-steg-lösningar på dina frågor från en expert inom området. Dina första 30 minuter med en Chegg-handledare är gratis!