Share on

Regressziós elemzés > Prediction Interval

Mi az a Prediction Interval?

A regressziós elemzés a jövőbeli trendek előrejelzésére szolgál.

A predikciós intervallum a regresszióelemzésben az előrejelzésekkel együtt használt bizalmi intervallum (CI) egy típusa; ez egy olyan értéktartomány, amely egy új megfigyelés értékét jósolja meg a meglévő modellje alapján.

A predikciós és a bizalmi intervallumot gyakran összekeverik egymással. Ezek azonban nem egészen ugyanazok.


  • A konfidenciaintervallum egy populációs paraméterhez tartozó értéktartomány. Például egy populáció átlaga.
  • A predikciós intervallum az, ahová egy jövőbeli érték várhatóan esik.

A bizonytalanságok az intervallumokkal

Mint a legtöbb dolog a statisztikában, ez sem jelenti azt, hogy teljes bizonyossággal megjósolható, hogy egy-egy érték hova fog esni.

A konfidenciaintervallumokhoz mindig tartozik egy konfidenciaszint, amely a bizonytalanság egy fokát jelenti (az adatok véletlenszerűek, ezért a statisztikai elemzés eredményei soha nem 100%-ig biztosak).
Elmondhatjuk például, hogy egy akkumulátor átlagos élettartama (95%-os konfidenciaszinten) 100-110 óra. Ez azt mondja, hogy egy akkumulátor az esetek 95%-ában a 100 és 110 óra közötti tartományba esik.

Hasonlóképpen, az előrejelzési intervallum azt mondja meg, hogy elegendő számú minta esetén egy érték az idő bizonyos százalékában hova fog esni a jövőben. Az akkumulátor átlagos élettartamára vonatkozó 100 és 110 óra közötti 95%-os előrejelzési intervallum azt mondja, hogy a jövőben gyártott akkumulátorok az idő 95%-ában ebbe a tartományba fognak esni. Van 5% esély arra, hogy egy akkumulátor nem esik ebbe az intervallumba.

Mikor használjuk

Nagyon gyakori a konfidenciaintervallum használata az előrejelzési intervallum helyett, különösen az ökonometriában. Azonban a konfidenciaszint helyett előrejelzési intervallumot kell használnia, ha pontos eredményeket szeretne. Tegyük fel, hogy kiszámít egy konfidenciaintervallumot a vállalkozása átlagos napi kiadására, és azt találja, hogy az 5000 és 6000 dollár között van. Ez megmondja, hogy valószínűleg hol van az átlag. Ha ezt a CI-t használja az előrejelzési intervallum elkészítéséhez, akkor egy sokkal szűkebb intervallumot kap. Az előrejelzési intervallum például 2 500 és 7 500 dollár között lehet ugyanazon a megbízhatósági szinten. Ha mégis a konfidenciaintervallumot használja, akkor nagy valószínűséggel ez az intervallum nagyobb hibával fog rendelkezni, ami azt jelenti, hogy az értékek gyakrabban fognak az intervallumon kívül esni, mint ahogyan azt előre jelzi.


Az előrejelzési intervallumok és együtthatók értelmezésekor legyen óvatos, ha a válaszváltozót transzformálja: a meredekség mást fog jelenteni, és minden előrejelzés és konfidencia/előrejelzési intervallum a transzformált válaszra fog vonatkozni (Morgan, 2014).

Hogyan találja meg a predikciós intervallumot

Kézzel a képlet a következő:

Valószínűleg azonban nem akarja használni a képletet, mivel a legtöbb statisztikai szoftver a regresszió kimenetében tartalmazza a predikciós intervallumot. Keresse a kimeneten a konfidenciaintervallum mellett 95%-os PI vagy hasonló megfogalmazásként.

  • SPSS: Kövesse a Youngstown State University munkatársa, Andy Chang által készített PDF 3. oldalán található utasításokat.
  • Minitab: Kattintson az “Opciók” fülre az Egyszerű regresszió párbeszédpanelen, majd jelölje be a PI opciót.

——————————————————————————

Segítségre van szüksége egy házi feladathoz vagy tesztkérdéshez? A Chegg Study segítségével lépésről lépésre megoldásokat kaphatsz a kérdéseidre egy szakértőtől. Az első 30 perc egy Chegg oktatóval ingyenes!

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.