Regressieanalyse >Voorspellingsinterval
Wat is een Voorspellingsinterval?
Regressieanalyse wordt gebruikt om toekomstige trends te voorspellen.
Een voorspellingsinterval is een soort betrouwbaarheidsinterval (CI) dat wordt gebruikt bij voorspellingen in regressieanalyse; het is een reeks waarden die de waarde van een nieuwe waarneming voorspelt, op basis van uw bestaande model.
Predictie- en betrouwbaarheidsintervallen worden vaak met elkaar verward. Ze zijn echter niet helemaal hetzelfde.
- Een betrouwbaarheidsinterval is een reeks waarden die bij een populatieparameter hoort. Bijvoorbeeld het gemiddelde van een populatie.
- Een voorspellingsinterval is waar u verwacht dat een toekomstige waarde zal vallen.
De onzekerheden met intervallen
Zoals bij de meeste dingen in de statistiek, betekent het niet dat je met zekerheid kunt voorspellen waar één enkele waarde zal vallen.
Betrouwbaarheidsintervallen zijn altijd gekoppeld aan een betrouwbaarheidsniveau, dat een mate van onzekerheid vertegenwoordigt (gegevens zijn willekeurig, en dus zijn resultaten van statistische analyse nooit 100% zeker).
Zo zou je bijvoorbeeld kunnen zeggen dat de gemiddelde levensduur van een batterij (bij een betrouwbaarheidsniveau van 95%) 100 tot 110 uur is. Dit zegt u dat een batterij 95% van de tijd tussen 100 en 110 uur meegaat.
Op dezelfde manier vertelt het voorspellingsinterval u waar een waarde in de toekomst zal vallen, gegeven voldoende steekproeven, een bepaald percentage van de tijd. Een 95%-voorspellingsinterval van 100 tot 110 uur voor de gemiddelde levensduur van een batterij zegt u dat in de toekomst geproduceerde batterijen 95% van de tijd binnen dat bereik zullen vallen. Er is een kans van 5% dat een batterij niet in dit interval valt.
Wanneer te gebruiken
Het is heel gebruikelijk om het betrouwbaarheidsinterval te gebruiken in plaats van het voorspellingsinterval, vooral in de econometrie. U moet echter een voorspellingsinterval gebruiken in plaats van een betrouwbaarheidsinterval als u nauwkeurige resultaten wilt. Stel dat u een betrouwbaarheidsinterval berekent voor de gemiddelde dagelijkse uitgaven van uw bedrijf en vaststelt dat die tussen $5.000 en $6.000 liggen. Dat vertelt u waar het gemiddelde waarschijnlijk ligt. Als u die KI gebruikt om een voorspellingsinterval te maken, zult u een veel smaller interval hebben. Bijvoorbeeld, het voorspellingsinterval zou $2.500 tot $7.500 kunnen zijn bij hetzelfde betrouwbaarheidsniveau. Als u het betrouwbaarheidsinterval wel gebruikt, zal dat interval hoogstwaarschijnlijk meer fouten bevatten, wat betekent dat waarden vaker buiten dat interval zullen vallen dan u voorspelt.
Wees voorzichtig bij het interpreteren van voorspellingsintervallen en coëfficiënten als u de responsvariabele transformeert: de helling zal iets anders betekenen en eventuele voorspellingen en betrouwbaarheids-/voorspellingsintervallen zullen voor de getransformeerde respons zijn (Morgan, 2014).
Hoe vindt u een voorspellingsinterval
Met de hand is de formule:
U zult de formule echter waarschijnlijk niet willen gebruiken, omdat de meeste statistische software het voorspellingsinterval zal opnemen in de uitvoer voor regressie. Zoek het naast het betrouwbaarheidsinterval in de uitvoer als 95% PI of soortgelijke bewoordingen.
- SPSS: Volg de instructies op pagina 3 van deze PDF door Andy Chang van de Youngstown State University.
- Minitab: Klik op het tabblad “Opties” in het dialoogvenster Simple Regression en vink vervolgens de optie PI aan.
——————————————————————————
Hulp nodig bij een huiswerk- of toetsvraag? Met Chegg Study kunt u stap-voor-stap oplossingen voor uw vragen krijgen van een expert op dit gebied. Uw eerste 30 minuten met een Chegg-leraar zijn gratis!