Diagnostics de régression logistique binaire

Après une procédure de modélisation, vous validez généralement le modèle. La commande Stat > Régression > Régression logistique binaire > Ajuster le modèle logistique binaire propose un ensemble de diagrammes de diagnostic, de tests d'adéquation de l'ajustement et autres mesures de diagnostic permettant de valider le modèle. Les valeurs résiduelles et autres statistiques de diagnostic permettent de repérer les problèmes potentiels suivants :
  • Combinaisons de facteurs/covariables dont la valeur ajustée n'est pas acceptable
  • Combinaisons de facteurs/covariables ayant une influence importante sur les estimations de paramètres
  • Combinaisons de facteurs/covariables ayant un effet de levier important

Minitab dispose de différentes options pour chacun de ces problèmes potentiels, présentées dans le tableau ci-dessous. Hosmer et Lemeshow1 indiquent que vous devez interpréter ces diagnostics de façon conjuguée afin de détecter d'éventuels problèmes avec le modèle.

Problème potentiel Statistiques de diagnostic Définition de la statistique
Combinaisons de facteurs/covariables dont la valeur ajustée n'est pas acceptable Valeur résiduelle de Pearson Différence entre observation réelle et observation prévue
Valeur résiduelle normalisée de Pearson Différence entre observation réelle et observation prévue, mais normalisées pour que σ = 1
Valeurs résiduelles de la somme des carrés d'écart Valeurs résiduelles de l'écart, qui sont une composante du Khi deux de l'écart
Khi deux du delta Variations du Khi deux de Pearson lorsque la je combinaison de facteurs/covariables est enlevée
Somme des carrés d'écart du delta Variations de l'écart lorsque la je combinaison de facteurs/covariables est enlevée
Combinaisons de facteurs/covariables ayant une influence importante sur les estimations de paramètres Bêta du delta calculé à l'aide des valeurs résiduelles de Pearson Variations des coefficients lorsque la je combinaison de facteurs/covariables est enlevée en fonction des valeurs résiduelles de Pearson
Bêta du delta calculé à l'aide des valeurs résiduelles normalisées de Pearson Variations des coefficients lorsque la je combinaison de facteurs/covariables est enlevée en fonction des valeurs résiduelles de Pearson
Combinaisons de facteurs/covariables ayant un effet de levier important Effet de levier (Hi) Effets de levier de la je combinaison de facteurs/covariables, mesure du degré d'aberration des valeurs des prédicteurs

Les graphiques des valeurs résiduelles vous permettent de visualiser certains de ces diagnostics. Vous pouvez également stocker et représenter d'autres diagnostics. Le Khi deux du delta et la somme des carrés d'écart du delta permettent d'identifier les combinaisons de facteurs/covariables pour lequel le modèle n'est pas correctement ajusté. Les statistiques du bêta du delta permettent d'identifier une combinaison de facteurs/covariables ayant une forte influence sur les paramètres estimés. En général, vous tracez ces statistiques du delta en fonction de la probabilité estimée de l'événement ou de l'effet de levier. La probabilité estimée de l'événement est la probabilité de l'événement compte tenu des données et du modèle. Les effets de levier servent à évaluer le degré d'aberration des valeurs des prédicteurs. Pour identifier les points, vous pouvez utiliser les fonctions de balayage proposées par Minitab sur les graphiques.

1 Hosmer, D.W. et Lemeshow, S. (2000), Applied Logistic Regression, 2e éd. John Wiley and Sons, Inc.