Regressionsanalyse >Vorhersageintervall
Was ist ein Vorhersageintervall?
Die Regressionsanalyse wird zur Vorhersage zukünftiger Trends verwendet.
Ein Vorhersageintervall ist eine Art Konfidenzintervall (CI), das bei Vorhersagen in der Regressionsanalyse verwendet wird; es ist ein Wertebereich, der den Wert einer neuen Beobachtung auf der Grundlage des vorhandenen Modells vorhersagt.
Vorhersage- und Konfidenzintervalle werden oft miteinander verwechselt. Sie sind jedoch nicht ganz dasselbe.
- Ein Konfidenzintervall ist ein Bereich von Werten, der mit einem Populationsparameter verbunden ist. Zum Beispiel der Mittelwert einer Population.
- Ein Vorhersageintervall ist der Bereich, in den ein zukünftiger Wert voraussichtlich fallen wird.
Die Unsicherheiten bei Intervallen
Wie bei den meisten Dingen in der Statistik bedeutet dies nicht, dass man mit Sicherheit vorhersagen kann, wohin ein einzelner Wert fallen wird.
Konfidenzintervalle sind immer mit einem Konfidenzniveau verbunden, das einen Grad der Unsicherheit darstellt (Daten sind zufällig, so dass die Ergebnisse einer statistischen Analyse nie zu 100 % sicher sind).
Zum Beispiel könnte man sagen, dass die mittlere Lebensdauer einer Batterie (bei einem Konfidenzniveau von 95 %) 100 bis 110 Stunden beträgt. Das bedeutet, dass eine Batterie in 95 % der Fälle in den Bereich von 100 bis 110 Stunden fallen wird.
Gleichermaßen sagt das Vorhersageintervall aus, wo ein Wert in der Zukunft bei genügend Stichproben in einem bestimmten Prozentsatz der Zeit liegen wird. Ein 95%iges Vorhersageintervall von 100 bis 110 Stunden für die mittlere Lebensdauer einer Batterie sagt aus, dass die künftig produzierten Batterien in 95% der Fälle in diesen Bereich fallen werden. Es besteht eine 5 %ige Chance, dass eine Batterie nicht in dieses Intervall fällt.
Wann ist es zu verwenden
Es ist sehr üblich, das Konfidenzintervall anstelle des Vorhersageintervalls zu verwenden, insbesondere in der Ökonometrie. Sie sollten jedoch ein Vorhersageintervall anstelle eines Konfidenzniveaus verwenden, wenn Sie genaue Ergebnisse erzielen wollen. Angenommen, Sie berechnen ein Konfidenzintervall für die durchschnittlichen täglichen Ausgaben Ihres Unternehmens und stellen fest, dass sie zwischen 5.000 und 6.000 $ liegen. Das sagt Ihnen, wo der Mittelwert wahrscheinlich liegt. Wenn Sie dieses Konfidenzintervall verwenden, um ein Prognoseintervall zu erstellen, erhalten Sie ein viel engeres Intervall. Das Vorhersageintervall könnte zum Beispiel bei gleichem Konfidenzniveau zwischen 2.500 und 7.500 $ liegen. Wenn Sie das Konfidenzintervall verwenden, ist es sehr wahrscheinlich, dass das Intervall mehr Fehler aufweist, was bedeutet, dass die Werte häufiger außerhalb des Intervalls liegen, als Sie vorhersagen.
Sein Sie vorsichtig bei der Interpretation von Vorhersageintervallen und Koeffizienten, wenn Sie die Antwortvariable transformieren: Die Steigung bedeutet etwas anderes und alle Vorhersagen und Konfidenz-/Vorhersageintervalle gelten für die transformierte Antwort (Morgan, 2014).
Wie findet man ein Vorhersageintervall
Mit der Hand lautet die Formel:
Sie werden die Formel wahrscheinlich nicht verwenden wollen, da die meisten Statistikprogramme das Vorhersageintervall in die Ausgabe für die Regression einbeziehen. Achten Sie darauf, dass es neben dem Konfidenzintervall in der Ausgabe als 95% PI oder in einer ähnlichen Formulierung angegeben ist.
- SPSS: Folgen Sie den Anweisungen auf Seite 3 dieses PDF von Andy Chang von der Youngstown State University.
- Minitab: Klicken Sie im Dialogfeld „Einfache Regression“ auf die Registerkarte „Optionen“ und aktivieren Sie dann die Option „PI“.
——————————————————————————
Brauchen Sie Hilfe bei einer Hausaufgabe oder einer Prüfungsfrage? Mit Chegg Study können Sie Schritt-für-Schritt-Lösungen zu Ihren Fragen von einem Experten auf dem Gebiet erhalten. Die ersten 30 Minuten mit einem Chegg-Lehrer sind kostenlos!