Regresní analýza > Predikční interval
Co je to predikční interval?
Regresní analýza se používá k předpovídání budoucích trendů.
Predikční interval je typ intervalu spolehlivosti (CI), který se používá u předpovědí v regresní analýze; je to rozsah hodnot, který předpovídá hodnotu nového pozorování na základě vašeho stávajícího modelu.
Predikční a konfidenční intervaly se často vzájemně zaměňují. Nejsou však zcela totožné.
- Interval spolehlivosti je rozsah hodnot spojených s populačním parametrem. Například střední hodnota populace.
- Předpovědní interval je místo, kam podle očekávání spadá budoucí hodnota.
Nejistoty s intervaly
Stejně jako u většiny věcí ve statistice to neznamená, že můžete s jistotou předpovědět, kam spadne jedna jediná hodnota.
Intervaly spolehlivosti jsou vždy spojeny s hladinou spolehlivosti, která představuje určitý stupeň nejistoty (data jsou náhodná, a proto výsledky statistické analýzy nejsou nikdy stoprocentně jisté).
Například můžete říci, že průměrná životnost baterie (při 95% hladině spolehlivosti) je 100 až 110 hodin. To vám říká, že baterie bude v rozmezí 100 až 110 hodin v 95 % případů.
Podobně vám interval předpovědi říká, kam se hodnota v budoucnu při dostatečném počtu vzorků dostane v určitém procentu případů. Interval predikce 95 % 100 až 110 hodin pro střední životnost baterie vám říká, že budoucí vyrobené baterie budou spadat do tohoto intervalu v 95 % případů. Existuje 5% šance, že baterie do tohoto intervalu nespadne.
Kdy ho použít
Velmi často se používá interval spolehlivosti místo intervalu předpovědi, zejména v ekonometrii. Pokud však chcete získat přesné výsledky, měli byste místo intervalu spolehlivosti použít interval predikce. Řekněme, že vypočtete interval spolehlivosti pro průměrné denní výdaje vašeho podniku a zjistíte, že se pohybují mezi 5 000 a 6 000 USD. To vám říká, kde pravděpodobně leží průměrná hodnota. Pokud tuto CI použijete k sestavení předpovědního intervalu, získáte mnohem užší interval. Například interval předpovědi by mohl být 2 500 až 7 500 USD při stejné hladině spolehlivosti. Pokud použijete interval spolehlivosti, je velmi pravděpodobné, že tento interval bude mít větší chybu, což znamená, že hodnoty budou mimo tento interval častěji, než jste předpovídali.
Při interpretaci intervalů předpovědí a koeficientů buďte opatrní, pokud proměnnou odpovědi transformujete: sklon bude znamenat něco jiného a veškeré předpovědi a intervaly spolehlivosti/předpovědi budou pro transformovanou odpověď (Morgan, 2014).
Jak zjistit interval predikce
Ručně je vzorec následující:
Pravděpodobně však nebudete chtít použít vzorec, protože většina statistického softwaru zahrnuje interval predikce do výstupu pro regresi. Hledejte ho ve výstupu vedle intervalu spolehlivosti jako 95% PI nebo v podobném znění.
- SPSS: Postupujte podle pokynů na straně 3 tohoto PDF souboru od Andyho Changa z Youngstown State University.
- Minitab:
——————————————————————————
Potřebujete pomoci s domácím úkolem nebo testovou otázkou? S Chegg Study můžete získat řešení svých otázek krok za krokem od odborníka v oboru. Prvních 30 minut s lektorem Chegg je zdarma!