Interprétation des résultats principaux pour la fonction Droite d'ajustement

Suivez la procédure ci-dessous pour interpréter une droite d'ajustement. Les résultats principaux incluent la valeur de p, la droite d'ajustement, R2 et les graphiques des valeurs résiduelles.

Etape 1 : Déterminer si l'association entre la réponse et le terme est statistiquement significative

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est que le coefficient du terme est égal à zéro, ce qui indique qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Si vous ajustez un modèle quadratique ou cubique et que les termes quadratiques ou cubiques sont significatifs, vous pouvez en conclure que les données contiennent une courbure.
Valeur de p > α : l'association n'est pas statistiquement significative.

Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Si vous ajustez un modèle quadratique ou cubique et que les termes quadratiques ou cubiques ne sont pas statistiquement significatifs, il est sans doute nécessaire de sélectionner un modèle différent.

Analyse de variance Somme des Source DL carrés CM F P Régression 1 11552,8 11552,8 146,86 0,000 Erreur 27 2124,0 78,7 Total 28 13676,7
Résultat principal : valeur de p

Dans ces résultats, la valeur de p pour la densité est 0,00, ce qui est inférieur au seuil de signification de 0,05. Ces résultats indiquent que l'association entre la rigidité et la densité est statistiquement significative.

Etape 2 : Déterminer si la droite de régression est ajustée à vos données

Evaluez l'ajustement du modèle à vos données et déterminez si le modèle est adapté à vos objectifs. Etudiez la droite d'ajustement pour savoir si les critères suivants sont respectés :
  • L'échantillon contient le nombre approprié d'observations sur l'étendue entière des valeurs de prédicteur.
  • Le modèle s'ajuste parfaitement à n'importe quelle courbure des données. Si vous ajustez un modèle linéaire et constatez une courbure dans les données, répétez l'analyse et sélectionnez le modèle cubique ou quadratique. Pour déterminer le modèle qui convient le mieux, étudiez la droite d'ajustement et les statistiques d'adéquation de l'ajustement. Observez la valeur de p des termes du modèle pour vous assurer qu'ils sont significatifs d'un point de vue statistique, puis appliquez vos connaissances du procédé pour déterminer s'ils le sont également dans la pratique.
  • Recherchez les éventuelles valeurs aberrantes susceptibles d'influencer les résultats. Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Pensez éventuellement à supprimer les valeurs de données associées à des événements anormaux et uniques (causes spéciales). Ensuite, répétez l'analyse. Pour plus d'informations sur la détection des valeurs aberrantes, reportez-vous à la rubrique Observations aberrantes.
Sur cette droite d'ajustement, les points suivent généralement la droite de régression. En outre, les points couvrent bien l'étendue entière des valeurs de densité. Il ne semble pas y avoir de courbure dans les données. Toutefois, le point situé dans le coin supérieur droit du graphique semble correspondre à une valeur aberrante. Etudiez ce point pour expliquer sa position.

Etape 3 : Etudier la relation entre le terme et la réponse

Si la valeur de p du terme est significative, vous pouvez examiner l'équation de régression pour connaître la relation entre le terme et la réponse.

Une équation de régression permet de décrire la relation entre la réponse et les termes du modèle. L'équation de régression est une représentation algébrique de la droite de régression. L'équation de régression pour le modèle linéaire prend la forme suivante : Y= b0 + b1x1. Dans l'équation de régression, Y représente la variable de réponse, b0 est la constante ou l'ordonnée à l'origine, b1 est le coefficient estimé du terme linéaire (également appelé pente de la droite) et x1 est la valeur du terme.

Le coefficient du terme représente la variation de la réponse moyenne lorsque le terme est modifié d'une unité. Le signe du coefficient indique la direction de la relation entre le terme et la réponse. Si le coefficient est négatif, plus le terme augmente, plus la valeur moyenne de la réponse diminue. Si le coefficient est positif, plus le terme augmente, plus la valeur moyenne de la réponse augmente.

Par exemple, le responsable d'une entreprise considère que les résultats d'un employé à un test de compétences professionnelles peuvent être prévus à l'aide du modèle de régression y = 130 + 4,3x. Dans cette équation, x représente les heures de formation sur les lieux de travail (de 0 à 20) et y représente le résultat au test. Le coefficient, ou la pente, est de 4,3, ce qui signifie que pour chaque nouvelle heure de formation, le résultat moyen au test augmente de 4,3 points.

Pour plus d'informations sur les coefficients, reportez-vous à la rubrique Coefficients de régression.

L'équation de régression est Rigidité = - 21,53 + 3,541 Densité
Résultats principaux : équation de régression, coefficient

Dans ces résultats, le coefficient du prédicteur, Densité, est de 3,541. La rigidité moyenne du panneau de particules augmente d'environ 3,5 pour chaque augmentation d'une unité de la densité. Le signe du coefficient est positif, ce qui indique que la rigidité augmente avec la densité.

Etape 4 : Déterminer l'ajustement du modèle à vos données

Pour déterminer l'ajustement du modèle aux données, étudiez les statistiques d'adéquation de l'ajustement dans le tableau Récapitulatif du modèle.

R carré

R2 représente le pourcentage de variation de la réponse expliqué par le modèle. Plus la valeur R2 est élevée, plus le modèle est ajusté à vos données. R2 est toujours compris entre 0 et 100 %.

La valeur R2 augmente toujours lorsque vous ajoutez des prédicteurs à un modèle. Par exemple, le meilleur modèle à 5 prédicteurs aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 prédicteurs. Par conséquent, R2 est surtout utile pour comparer des modèles de même taille.

R carré (ajust)

Utilisez la valeur R2 ajusté pour comparer des modèles n'ayant pas le même nombre de prédicteurs. R2 augmente toujours lorsque vous ajoutez un prédicteur au modèle, même lorsque ce prédicteur n'apporte aucune amélioration réelle au modèle. La valeur de R2 ajusté intègre le nombre de prédicteurs dans le modèle pour vous aider à choisir le modèle correct.

Prenez en compte les points suivants lorsque vous comparez les valeurs de R2 :
  • Les petits échantillons ne fournissent pas d'estimation précise de la force de la relation entre la réponse et les prédicteurs. Pour obtenir une valeur R2 plus précise, vous devez utiliser un échantillon plus grand (en général, 40 ou plus).

  • R2 n'est qu'une des mesures de l'ajustement du modèle aux données. Même si un modèle a une valeur R2 élevée, vous devez consulter les graphiques des valeurs résiduelles pour vérifier que le modèle respecte les hypothèses.

Récapitulatif du modèle R carré S R carré (ajust) 8,86937 84,47% 83,89%
Résultat principal : R carré

Dans ces résultats, la densité du panneau de particules explique 84,5 % de la variation de rigidité des panneaux. La valeur de R2 indique que le modèle est bien ajusté aux données.

Etape 5 : Déterminer si votre modèle vérifie les hypothèses de l'analyse

Les graphiques des valeurs résiduelles permettent de déterminer si le modèle est adapté et si les hypothèses de l'analyse sont vérifiées. Si elles ne le sont pas, il se peut que le modèle ne soit pas ajusté aux données et vous devez être prudent lors de l'interprétation des résultats.

Graphique des valeurs résiduelles en fonction des valeurs ajustées

Utilisez le diagramme des valeurs résiduelles en fonction des valeurs ajustées pour vérifier l'hypothèse selon laquelle les valeurs résiduelles suivent une loi normale et ont une variance constante. Dans l'idéal, les points doivent être répartis aléatoirement des deux côtés de 0, sans schéma reconnaissable.

Les schémas du tableau suivant peuvent indiquer que le modèle n'est pas adapté.
Schéma Ce que le schéma indique
Eparpillement ou répartition déséquilibrée des valeurs résiduelles en fonction des valeurs ajustées Variance non constante
Curviligne Un terme d'ordre supérieur manquant
Un point très éloigné de zéro Une valeur aberrante
Un point éloigné des autres points dans le sens des x Un point influent
Dans ce graphique des valeurs résiduelles en fonction des valeurs ajustées, les points sont dispersés aléatoirement. Toutefois, le point situé dans le coin supérieur droit semble correspondre à une valeur aberrante. Essayez d'en déterminer la cause. Corrigez les erreurs de mesure ou d’entrée des données. Pensez éventuellement à supprimer les valeurs de données associées à des événements anormaux et uniques (causes spéciales). Ensuite, répétez l'analyse.

Graphique des valeurs résiduelles en fonction de l'ordre

Utilisez le diagramme des valeurs résiduelles en fonction de l'ordre pour vérifier l'hypothèse selon laquelle les valeurs résiduelles sont indépendantes les unes par rapport aux autres. Les valeurs résiduelles indépendantes ne présentent aucune tendance ou schéma lorsqu'elles sont affichées dans un ordre chronologique. La présence de schémas dans les points peut indiquer que les valeurs résiduelles qui sont proches les unes des autres peuvent être corrélées, et ne sont donc pas indépendantes. Idéalement, les valeurs résiduelles du graphique doivent être réparties de façon aléatoire autour de la ligne centrale.
Si vous observez un schéma, étudiez-en la cause. Les types de schémas suivants peuvent indiquer que les valeurs résiduelles sont corrélées.
Tendance
Equipe
Cycle
Dans ce graphique des valeurs résiduelles en fonction de l'ordre, la valeur aberrante qui est également visible sur les autres graphiques des valeurs résiduelles correspond visiblement à l'observation de la ligne 21 de la feuille de travail.

Droite de Henry

Utilisez la droite de Henry des valeurs résiduelles afin de vérifier l'hypothèse selon laquelle les valeurs résiduelles sont normalement distribuées. La droite de Henry des valeurs résiduelles doit suivre approximativement une ligne droite.

Les schémas du tableau suivant peuvent indiquer que le modèle n'est pas adapté.
Schéma Ce que le schéma indique
Une ligne qui n'est pas droite Non-normalité
Un point éloigné de la ligne Une valeur aberrante
Une modification de la pente Une variable non identifiée
Dans cette droite de Henry, les valeurs résiduelles semblent généralement suivre une ligne droite. Toutefois, le point situé dans le coin supérieur droit du graphique est très écarté de la droite et semble correspondre à une valeur aberrante, ce qui était également visible sur les autres graphiques des valeurs résiduelles.

Pour plus d'informations sur la manière de traiter les schémas dans les graphiques des valeurs résiduelles, reportez-vous à la rubrique Graphiques des valeurs résiduelles pour la fonction Droite d'ajustement.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique