Droite d'ajustement pour la fonction Droite d'ajustement

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour la droite d'ajustement.

Droite d'ajustement

La droite d'ajustement affiche les données de prévision et de réponse. Le graphique comprend la droite de régression, qui représente l'équation de régression. Vous pouvez également afficher les intervalles de prévision et de confiance à 95 % sur le graphique.

Interprétation

Evaluez l'ajustement du modèle à vos données et déterminez si le modèle est adapté à vos objectifs. Etudiez la droite d'ajustement pour savoir si les critères suivants sont respectés :
  • L'échantillon contient le nombre approprié d'observations sur l'étendue entière des valeurs de prédicteur.
  • Le modèle s'ajuste parfaitement à n'importe quelle courbure des données. Si vous ajustez un modèle linéaire et constatez une courbure dans les données, répétez l'analyse et sélectionnez le modèle cubique ou quadratique. Pour déterminer le modèle qui convient le mieux, étudiez la droite d'ajustement et les statistiques d'adéquation de l'ajustement. Observez la valeur de p des termes du modèle pour vous assurer qu'ils sont significatifs d'un point de vue statistique, puis appliquez vos connaissances du procédé pour déterminer s'ils le sont également dans la pratique.
  • Recherchez les éventuelles valeurs aberrantes susceptibles d'influencer les résultats. Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Pensez éventuellement à supprimer les valeurs de données associées à des événements anormaux et uniques (causes spéciales). Ensuite, répétez l'analyse. Pour plus d'informations sur la détection des valeurs aberrantes, reportez-vous à la rubrique Observations aberrantes.

Equation de régression

Une équation de régression permet de décrire la relation entre la réponse et les termes du modèle. L'équation de régression est une représentation algébrique de la droite de régression. L'équation de régression pour le modèle linéaire prend la forme suivante : Y= b0 + b1x1. Dans l'équation de régression, Y représente la variable de réponse, b0 est la constante ou l'ordonnée à l'origine, b1 est le coefficient estimé du terme linéaire (également appelé pente de la droite) et x1 est la valeur du terme.

L'équation de régression avec plusieurs termes prend la forme suivante :

y = b0 + b1X1 + b2X2 + ... + bkXk

Dans l'équation de régression, les lettres représentent les éléments suivants :
  • y est la variable de réponse
  • b0 est la constante
  • b1, b2, ..., bk sont les coefficients
  • X1, X2, ..., Xk sont les valeurs du terme

Coefficients d'équation

Un coefficient de régression décrit l'importance et le sens de la relation entre un prédicteur et la variable de réponse. Les coefficients sont les nombres par lesquels les valeurs du terme sont multipliées dans une équation de régression.

Interprétation

Le coefficient du terme représente la variation de la réponse moyenne lorsque le terme est modifié d'une unité. Le signe du coefficient indique la direction de la relation entre le terme et la réponse. Si le coefficient est négatif, plus le terme augmente, plus la valeur moyenne de la réponse diminue. Si le coefficient est positif, plus le terme augmente, plus la valeur moyenne de la réponse augmente.

Par exemple, le responsable d'une entreprise considère que les résultats d'un employé à un test de compétences professionnelles peuvent être prévus à l'aide du modèle de régression y = 130 + 4,3x. Dans cette équation, x représente les heures de formation sur les lieux de travail (de 0 à 20) et y représente le résultat au test. Le coefficient, ou la pente, est de 4,3, ce qui signifie que pour chaque nouvelle heure de formation, le résultat moyen au test augmente de 4,3 points.

La taille du coefficient aide généralement à évaluer si l'effet d'un terme sur la variable de réponse est significatif dans la pratique. Toutefois, l'importance du coefficient n'indique pas si un terme est statistiquement significatif ou non car le calcul de la signification prend également en compte la variation des données de réponse. Pour évaluer la signification statistique, examinez la valeur de p du terme.

IC à 95 %

L'intervalle de confiance pour la valeur ajustée fournit une étendue de valeurs possibles pour la réponse moyenne en fonction des paramètres spécifiés pour les prédicteurs.

Interprétation

Utilisez l'intervalle de confiance afin d'évaluer l'estimation de la valeur ajustée pour les valeurs observées des variables.

Par exemple, avec un niveau de confiance de 95 %, vous pouvez être sûr à 95 % que l'intervalle de confiance comprend la moyenne de la population pour les valeurs indiquées des variables du modèle. L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Un grand intervalle de confiance traduit moins de certitude quant à la moyenne des futures valeurs. Si l'intervalle est trop grand pour être utile, envisagez d'augmenter l'effectif de l'échantillon.

IP de 95 %

L'intervalle de prévision est une étendue ayant de fortes chances de contenir une réponse future pour une valeur de la variable de prédiction.

Interprétation

Avec des bornes de prévision à 95 %, vous pouvez être certain à 95 % que les nouvelles observations seront comprises dans l'intervalle indiqué par les droites violettes. (Remarquez cependant que ceci n'est vrai que pour les valeurs de densité qui se trouvent dans l'étendue incluse dans l'analyse.)

Par exemple, un ingénieur spécialisé dans les matériaux travaillant pour une entreprise de fabrication de meubles élabore un modèle de régression simple pour prévoir la rigidité d'un panneau de particules à partir de la densité du panneau. Il vérifie que le modèle satisfait aux hypothèses de l'analyse. L'analyste utilise ensuite le modèle pour prévoir la rigidité.

L'équation de régression prévoit que la rigidité pour une nouvelle observation avec une densité de 20 est égale à 12,70 – 1,517*20 + 0,1622*202, soit 47,24. Bien qu'il soit peu probable qu'une telle observation ait une rigidité exacte de 47,24, l'intervalle de prévision indique que l'ingénieur peut être certain à 95 % que la valeur réelle sera comprise entre 31 et 63 environ.

L'intervalle de prévision est toujours plus large que l'intervalle de confiance correspondant. Dans cet exemple, l'intervalle de confiance de 95 % indique que l'ingénieur peut être certain à 95 % que la rigidité moyenne sera comprise entre 43 et 50 environ.