Analisi di regressione >Intervallo di predizione
Cos’è un intervallo di predizione?
L’analisi di regressione è usata per prevedere tendenze future.
Un intervallo di predizione è un tipo di intervallo di confidenza (CI) usato con le predizioni nell’analisi di regressione; è un intervallo di valori che predice il valore di una nuova osservazione, basato sul tuo modello esistente. Tuttavia, non sono proprio la stessa cosa.
- Un intervallo di confidenza è un intervallo di valori associato a un parametro della popolazione. Per esempio, la media di una popolazione.
- Un intervallo di previsione è dove ci si aspetta che un valore futuro cada.
Le incertezze con gli intervalli
Come la maggior parte delle cose in statistica, non significa che puoi prevedere con certezza dove cadrà un singolo valore.
Gli intervalli di confidenza sono sempre associati a un livello di confidenza, che rappresenta un grado di incertezza (i dati sono casuali, e quindi i risultati delle analisi statistiche non sono mai certi al 100%).
Per esempio, si potrebbe dire che la vita media di una batteria (a un livello di confidenza del 95%) va da 100 a 110 ore. Questo vi dice che una batteria cadrà nell’intervallo da 100 a 110 ore il 95% delle volte.
Similmente, l’intervallo di previsione vi dice dove un valore cadrà in futuro, dati abbastanza campioni, una certa percentuale delle volte. Un intervallo di previsione del 95% da 100 a 110 ore per la vita media di una batteria vi dice che le future batterie prodotte cadranno in quell’intervallo il 95% delle volte. C’è un 5% di possibilità che una batteria non rientri in questo intervallo.
Quando usarlo
È molto comune usare l’intervallo di confidenza al posto dell’intervallo di previsione, specialmente in econometria. Tuttavia, dovresti usare un intervallo di predizione invece di un livello di confidenza se vuoi risultati accurati. Diciamo che calcolate un intervallo di confidenza per la spesa media giornaliera della vostra azienda e scoprite che è tra 5.000 e 6.000 dollari. Questo ti dice dove si trova probabilmente la media. Se usate quel CI per fare un intervallo di previsione, avrete un intervallo molto più stretto. Per esempio, l’intervallo di previsione potrebbe essere da 2.500 a 7.500 dollari allo stesso livello di confidenza. Se usi l’intervallo di confidenza, è molto probabile che quell’intervallo avrà più errori, il che significa che i valori cadranno al di fuori di quell’intervallo più spesso di quanto tu preveda.
Fai attenzione quando interpreti gli intervalli di previsione e i coefficienti se trasformi la variabile di risposta: la pendenza avrà un significato diverso e qualsiasi previsione e intervallo di confidenza/previsione sarà per la risposta trasformata (Morgan, 2014).
Come trovare un intervallo di predizione
A mano, la formula è:
Ma probabilmente non vorrete usare la formula, perché la maggior parte dei software statistici include l’intervallo di predizione nell’output della regressione. Cercatelo accanto all’intervallo di confidenza nell’output come 95% PI o una dicitura simile.
- SPSS: Seguite le istruzioni a pagina 3 di questo PDF di Andy Chang della Youngstown State University.
- Minitab: Fai clic sulla scheda “Opzioni” nella finestra di dialogo Regressione semplice, quindi seleziona l’opzione PI.
——————————————————————————
Hai bisogno di aiuto per un compito o una domanda di un test? Con Chegg Study, puoi ottenere soluzioni passo dopo passo alle tue domande da un esperto del settore. I tuoi primi 30 minuti con un tutor Chegg sono gratuiti!