Analyse de régression >Intervalle de prédiction
Qu’est-ce qu’un intervalle de prédiction?
L’analyse de régression est utilisée pour prédire les tendances futures.
Un intervalle de prédiction est un type d’intervalle de confiance (IC) utilisé avec les prédictions dans l’analyse de régression ; c’est une plage de valeurs qui prédit la valeur d’une nouvelle observation, sur la base de votre modèle existant.
Les intervalles de prédiction et de confiance sont souvent confondus l’un avec l’autre. Cependant, ils ne sont pas tout à fait la même chose.
- Un intervalle de confiance est une plage de valeurs associée à un paramètre de population. Par exemple, la moyenne d’une population.
- Un intervalle de prédiction est l’endroit où vous vous attendez à ce qu’une valeur future tombe.
Les incertitudes avec les intervalles
Comme la plupart des choses en statistique, cela ne signifie pas que vous pouvez prédire avec certitude où une seule valeur tombera.
Les intervalles de confiance sont toujours associés à un niveau de confiance, représentant un degré d’incertitude (les données étant aléatoires, les résultats d’une analyse statistique ne sont jamais sûrs à 100 %).
Par exemple, vous pourriez dire que la durée de vie moyenne d’une batterie (à un niveau de confiance de 95 %) est de 100 à 110 heures. Cela vous indique qu’une batterie se situera dans la fourchette de 100 à 110 heures dans 95 % des cas.
De même, l’intervalle de prédiction vous indique où une valeur tombera dans le futur, étant donné suffisamment d’échantillons, un certain pourcentage du temps. Un intervalle de prédiction de 95% de 100 à 110 heures pour la durée de vie moyenne d’une batterie vous indique que les futures batteries produites se situeront dans cette fourchette 95% du temps. Il y a 5% de chances qu’une batterie ne tombe pas dans cet intervalle.
Quand l’utiliser
Il est très courant d’utiliser l’intervalle de confiance à la place de l’intervalle de prédiction, notamment en économétrie. Cependant, vous devriez utiliser un intervalle de prédiction au lieu d’un niveau de confiance si vous voulez des résultats précis. Disons que vous calculez un intervalle de confiance pour la dépense quotidienne moyenne de votre entreprise et que vous trouvez qu’elle se situe entre 5 000 et 6 000 dollars. Cela vous indique où se situe probablement la moyenne. Si vous utilisez cet IC pour établir un intervalle de prédiction, vous obtiendrez un intervalle beaucoup plus étroit. Par exemple, l’intervalle de prédiction pourrait être de 2 500 $ à 7 500 $ au même niveau de confiance. Si vous utilisez effectivement l’intervalle de confiance, il est très probable que cet intervalle aura plus d’erreur, ce qui signifie que les valeurs tomberont en dehors de cet intervalle plus souvent que vous ne le prévoyez.
Soyez prudent lors de l’interprétation des intervalles de prédiction et des coefficients si vous transformez la variable de réponse : la pente aura une signification différente et toutes les prédictions et les intervalles de confiance/de prédiction seront pour la réponse transformée (Morgan, 2014).
Comment trouver un intervalle de prédiction
À la main, la formule est :
Vous ne voudrez probablement pas utiliser la formule cependant, car la plupart des logiciels statistiques incluront l’intervalle de prédiction dans la sortie pour la régression. Cherchez-le à côté de l’intervalle de confiance dans la sortie comme 95% PI ou une formulation similaire.
- SPSS : Suivez les instructions de la page 3 de ce PDF par Andy Chang de l’Université d’État de Youngstown.
- Minitab : Cliquez sur l’onglet « Options » de la boîte de dialogue Régression simple, puis cochez l’option PI.
——————————————————————————
Vous avez besoin d’aide pour un devoir ou une question de test ? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions de la part d’un expert en la matière. Vos 30 premières minutes avec un tuteur Chegg sont gratuites !