L'histogramme des valeurs résiduelles des sommes des carrés d'écart montre la distribution des valeurs résiduelles pour toutes les observations.
Que vous utilisiez les valeurs résiduelles de la somme des carrés d'écart ou de Pearson, l'interprétation du graphique est la même. Lorsque le modèle utilise la fonction de liaison logit, la loi de distribution des valeurs résiduelles de la somme des carrés d'écart est plus proche de la loi de distribution des valeurs résiduelles issues d'un modèle de régression sur les moindres carrés. Plus le nombre d'essais pour chaque combinaison de paramètres de prévision augmente, plus les valeurs résiduelles de la somme des carrés d'écart et de Pearson deviennent similaires.
Schéma | Ce que le schéma indique |
---|---|
Longue extrémité dans une direction | Asymétrie |
Barre éloignée des autres | Une valeur aberrante |
Comme l'apparence de l'histogramme dépend du nombre d'intervalles utilisés pour regrouper les données, n'évaluez pas la normalité des valeurs résiduelles à l'aide d'un histogramme. Utilisez plutôt une droite de Henry.
La droite de Henry des valeurs résiduelles affiche les valeurs résiduelles en fonction de leurs valeurs attendues lorsque la loi de distribution est normale.
Que vous utilisiez les valeurs résiduelles de la somme des carrés d'écart ou de Pearson, l'interprétation du graphique est la même. Lorsque le modèle utilise la fonction de liaison logit, la loi de distribution des valeurs résiduelles de la somme des carrés d'écart est plus proche de la loi de distribution des valeurs résiduelles issues d'un modèle de régression sur les moindres carrés. Plus le nombre d'essais pour chaque combinaison de paramètres de prévision augmente, plus les valeurs résiduelles de la somme des carrés d'écart et de Pearson deviennent similaires.
Utilisez la droite de Henry des valeurs résiduelles afin de vérifier l'hypothèse selon laquelle les valeurs résiduelles sont normalement distribuées. La droite de Henry des valeurs résiduelles doit suivre approximativement une ligne droite.
Si vous observez une tendance non normale, utilisez les autres graphiques des valeurs résiduelles pour rechercher tout autre problème éventuel avec le modèle, tel que des termes manquants ou l'effet d'un ordre temporel. Si les valeurs résiduelles ne suivent pas une loi normale, les intervalles de confiance pour l'approximation selon la loi normale et les valeurs de p du test Wald peuvent être inexacts.
Pour la régression logistique binaire, Minitab ne propose pas ce diagramme lorsque les données sont au format réponse binaire/fréquence (un seul essai par ligne).
Que vous utilisiez les valeurs résiduelles de la somme des carrés d'écart ou de Pearson, l'interprétation du graphique est la même. Lorsque le modèle utilise la fonction de liaison logit, la loi de distribution des valeurs résiduelles de la somme des carrés d'écart est plus proche de la loi de distribution des valeurs résiduelles issues d'un modèle de régression sur les moindres carrés. Plus le nombre d'essais pour chaque combinaison de paramètres de prévision augmente, plus les valeurs résiduelles de la somme des carrés d'écart et de Pearson deviennent similaires.
Utilisez le diagramme des valeurs résiduelles en fonction des valeurs ajustées pour vérifier l'hypothèse selon laquelle les valeurs résiduelles sont normalement distribuées. Dans l'idéal, les points doivent être répartis aléatoirement des deux côtés de 0, sans schéma reconnaissable.
Schéma | Ce que le schéma indique |
---|---|
Eparpillement ou répartition déséquilibrée des valeurs résiduelles en fonction des valeurs ajustées | Une fonction de liaison inadaptée |
Curviligne | Un terme d'ordre supérieur manquant ou une fonction de liaison inadaptée |
Un point très éloigné de zéro | Une valeur aberrante |
Un point éloigné des autres points dans le sens des x | Un point influent |
Problème | Solution possible |
---|---|
Variance non constante | Envisagez d'utiliser d'autres termes dans le modèle, une autre fonction de liaison ou des pondérations |
Une valeur aberrante ou un point influant |
|
Le diagramme des valeurs résiduelles en fonction de l'ordre affiche les valeurs résiduelles dans l'ordre dans lequel les données ont été collectées.
Que vous utilisiez les valeurs résiduelles de la somme des carrés d'écart ou de Pearson, l'interprétation du graphique est la même. Lorsque le modèle utilise la fonction de liaison logit, la loi de distribution des valeurs résiduelles de la somme des carrés d'écart est plus proche de la loi de distribution des valeurs résiduelles issues d'un modèle de régression sur les moindres carrés. Plus le nombre d'essais pour chaque combinaison de paramètres de prévision augmente, plus les valeurs résiduelles de la somme des carrés d'écart et de Pearson deviennent similaires.
Le diagramme des valeurs résiduelles en fonction des variables affiche les valeurs résiduelles en fonction d'une autre variable. La variable peut déjà être présente dans votre modèle. Il se peut aussi que la variable ne soit pas dans le modèle, mais que vous la soupçonniez d'avoir un effet sur la réponse.
Que vous utilisiez les valeurs résiduelles de la somme des carrés d'écart ou de Pearson, l'interprétation du graphique est la même. Lorsque le modèle utilise la fonction de liaison logit, la loi de distribution des valeurs résiduelles de la somme des carrés d'écart est plus proche de la loi de distribution des valeurs résiduelles issues d'un modèle de régression sur les moindres carrés. Plus le nombre d'essais pour chaque combinaison de paramètres de prévision augmente, plus les valeurs résiduelles de la somme des carrés d'écart et de Pearson deviennent similaires.
Si la variable figure déjà dans le modèle, utilisez le diagramme pour déterminer si vous devez ajouter un terme d'ordre supérieur à la variable. Si la variable ne se trouve pas encore dans le modèle, utilisez le diagramme pour déterminer si elle influence la réponse de manière systématique.
Schéma | Ce que le schéma indique |
---|---|
Schéma dans les valeurs résiduelles | La variable influe sur la réponse de manière systématique. Si la variable ne figure pas dans votre modèle, incluez un terme pour elle et réajustez le modèle. |
Courbure décrite par les points | Un terme d'ordre supérieur de la variable doit être inclus dans le modèle. Par exemple, un schéma en courbe indique que vous devez ajouter un terme quadratique. |