Regressionsanalyse > Forudsigelsesinterval
Hvad er et forudsigelsesinterval?
Regressionsanalyse bruges til at forudsige fremtidige tendenser.
Et forudsigelsesinterval er en type konfidensinterval (CI), der bruges sammen med forudsigelser i regressionsanalyse; det er et interval af værdier, der forudsiger værdien af en ny observation, baseret på din eksisterende model.
Forudsigelses- og konfidensintervaller forveksles ofte med hinanden. De er dog ikke helt det samme.
- Et konfidensinterval er et interval af værdier, der er forbundet med en populationsparameter. F.eks. middelværdien af en population.
- Et forudsigelsesinterval er, hvor man forventer, at en fremtidig værdi vil falde.
Usikkerhederne med intervaller
Som de fleste ting inden for statistik betyder det ikke, at man med sikkerhed kan forudsige, hvor en enkelt værdi vil falde.
Vidensintervaller er altid forbundet med et konfidensniveau, der repræsenterer en grad af usikkerhed (data er tilfældige, og derfor er resultater fra statistiske analyser aldrig 100 % sikre).
For eksempel kan man sige, at den gennemsnitlige levetid for et batteri (med et konfidensniveau på 95 %) er 100 til 110 timer. Dette fortæller dig, at et batteri vil falde inden for intervallet 100 til 110 timer i 95 % af tilfældene.
På samme måde fortæller forudsigelsesintervallet dig, hvor en værdi vil falde i fremtiden, givet nok prøver, en vis procentdel af tiden. Et forudsigelsesinterval på 95 % på 100 til 110 timer for et batteris gennemsnitlige levetid fortæller dig, at fremtidige producerede batterier vil falde inden for dette interval 95 % af tiden. Der er 5% chance for, at et batteri ikke falder inden for dette interval.
Hvornår skal man bruge det
Det er meget almindeligt at bruge konfidensintervallet i stedet for forudsigelsesintervallet, især inden for økonometri. Du bør dog bruge et forudsigelsesinterval i stedet for et konfidensinterval, hvis du ønsker præcise resultater. Lad os sige, at du beregner et konfidensinterval for den gennemsnitlige daglige udgift i din virksomhed og finder ud af, at den ligger mellem 5.000 og 6.000 dollars. Det fortæller dig, hvor gennemsnittet sandsynligvis ligger. Hvis du bruger dette CI til at lave et forudsigelsesinterval, vil du få et meget smallere interval. For eksempel kan forudsigelsesintervallet være 2.500 $ til 7.500 $ på det samme konfidensniveau. Hvis du bruger konfidensintervallet, er det meget sandsynligt, at intervallet vil have flere fejl, hvilket betyder, at værdierne oftere vil falde uden for intervallet, end du forudsiger.
Vær forsigtig, når du fortolker forudsigelsesintervaller og koefficienter, hvis du transformerer responsvariablen: hældningen vil betyde noget andet, og eventuelle forudsigelser og konfidens-/forudsigelsesintervaller vil være for den transformerede respons (Morgan, 2014).
Sådan finder du et forudsigelsesinterval
Med hånden er formlen:
Du ønsker dog sandsynligvis ikke at bruge formlen, da de fleste statistiske programmer vil inkludere forudsigelsesintervallet i output for regression. Kig efter det ved siden af konfidensintervallet i output som 95% PI eller lignende ordlyd.
- SPSS: Følg instruktionerne på side 3 i denne PDF af Andy Chang fra Youngstown State University.
- Minitab: Klik på fanen “Options” i dialogboksen Simple Regression, og marker derefter indstillingen PI.
——————————————————————————
Har du brug for hjælp til en hjemmeopgave eller et testspørgsmål? Med Chegg Study kan du få trin-for-trin-løsninger på dine spørgsmål fra en ekspert på området. Dine første 30 minutter med en Chegg-underviser er gratis!