Méthodes et formules pour les mesures de diagnostic pour la fonction Ajuster le modèle logistique binaire

Sélectionnez la méthode ou la formule de votre choix.

Valeurs résiduelles de Pearson

Eléments du Khi deux de Pearson permettant de détecter les combinaisons de facteurs/covariables qui ne sont pas ajustées correctement. Minitab stocke la valeur résiduelle de Pearson pour la ie combinaison de facteurs/covariables. La formule est la suivante :

Notation

TermeDescription
yivaleur de la réponse pour la ie combinaison de facteurs/covariables
valeur ajustée pour la ie combinaison de facteurs/covariables
Vfonction de variance pour le modèle à

La fonction de variance dépend du modèle :

Modèle Fonction de variance
Binomiale
Poisson

Valeurs résiduelles normalisées et supprimées de Pearson

Utilisées pour détecter les combinaisons de facteurs/covariables qui ne sont pas ajustées correctement. Minitab stocke la valeur résiduelle normalisée de Pearson pour la ie combinaison de facteurs/covariables. Les valeurs résiduelles supprimées de Pearson sont également appelées valeurs résiduelles de Pearson du rapport de vraisemblance. Pour la valeur résiduelle supprimée de Pearson, Minitab calcule une approximation à une étape décrite dans Pregibon1. Cette approximation est égale à la valeur résiduelle normalisée de Pearson. La formule est la suivante :

Notation

TermeDescription
valeur résiduelle de Pearson pour la ie combinaison de facteurs/covariables
1, pour le modèle binomial et le modèle de Poisson
effet de levier pour la ie combinaison de facteurs/covariables

Valeurs résiduelles normalisées de Pearson avec validation

Pour les données de validation, le dénominateur de la formule relative aux valeurs résiduelles normalisées de Pearson ajoute l’effet de levier au lieu de le soustraire.

Formule

Notation

TermeDescription
the Pearson residual for the ie validation row
1, for the binomial and Poisson models
the leverage for the ie validation row

Valeurs résiduelles de la somme des carrés d'écart

Les valeurs résiduelles de la somme des carrés d'écart sont fondées sur la somme des carrés d’écart du modèle et permettent d'identifier les combinaisons de facteurs/covariables qui ne sont pas ajustées correctement. La somme des carrés d'écart du modèle est une statistique d'adéquation de l'ajustement qui repose sur la fonction de log de vraisemblance. La valeur résiduelle de la somme des carrés d'écart définie pour la ie combinaison de facteurs/covariables est la suivante :

Notation

TermeDescription
yi valeur de la réponse pour la ie combinaison de facteurs/covariables
valeur ajustée pour la ie combinaison de facteurs/covariables
somme des carrés d'écart pour la ie combinaison de facteurs/covariables

Valeurs résiduelles normalisées de la somme des carrés d'écart

La valeur résiduelle normalisée de la somme des carrés d'écart permet d'identifier les valeurs aberrantes. La formule est la suivante :

Notation

TermeDescription
rD,iValeur résiduelle de la somme des carrés d'écart pour la ie combinaison de facteurs/covariables
hiEffet de levier pour la ie combinaison de facteurs/covariables

Valeur résiduelle normalisée de la somme des carrés des écarts avec validation

Pour les données de validation, le dénominateur de la formule relative aux valeurs résiduelles normalisées de la somme des carrés des écarts ajoute l’effet de levier au lieu de le soustraire.

Formule

Notation

TermeDescription
rD,iThe deviance residual for the ie validation row
hiThe leverage for the ie validation row

Valeurs résiduelles des sommes des carrés d'écart supprimées

La valeur résiduelle supprimée de la somme des carrés d'écart mesure la variation de la somme des carrés d'écart due à l'omission de la ie case des données. Les valeurs résiduelles supprimées de la somme des carrés d'écart sont également appelées "valeurs résiduelles de la somme des carrés d'écart du rapport de vraisemblance". Pour la valeur résiduelle supprimée de la somme des carrés d'écart, Minitab calcule une approximation à une étape fondée sur la méthode d'approximation à une étape de Pregibon1. La formule est la suivante :

Notation

TermeDescription
yivaleur de la réponse au niveau de la ie combinaison de facteurs/covariables
valeur ajustée pour la ie combinaison de facteurs/covariables
hieffet de levier pour la ie combinaison de facteurs/covariables
r'D,ivaleurs résiduelles normalisées de la somme des carrés d'écart pour la ie combinaison de facteurs/covariables
r'P,ivaleur résiduelle de Pearson normalisée pour la ie combinaison de facteurs/covariables

1. Pregibon, D. (1981). "Logistic Regression Diagnostics", The Annals of Statistics, Vol. 9, No 4 pp. 705–724.

Khi deux du delta

Minitab calcule la variation dans le Khi deux de Pearson due à la suppression de toutes les observations avec la je combinaison de facteurs/covariables. Minitab stocke une valeur de Khi deux du delta pour chaque combinaison de facteurs/covariables dans les données. Vous pouvez utiliser le Khi deux du delta pour détecter les combinaisons de facteurs/covariables qui ne sont pas ajustées correctement. La formule pour le Khi deux du delta est la suivante :

Formule

Notation

TermeDescription
hj effet de levier
rj Valeurs résiduelles de Pearson

Somme des carrés d'écart du delta

Minitab calcule la variation de la somme des carrés d'écart en supprimant toutes les observations avec la je combinaison de facteurs/covariables. Minitab stocke une valeur pour chaque combinaison de facteurs/covariables dans les données. Vous pouvez utiliser la somme des carrés d'écart du delta pour détecter les combinaisons de facteurs/covariables qui ne sont pas ajustées correctement. La variance de la statistique de la somme des carrés d'écart est la suivante :

Notation

TermeDescription
hjeffet de levier
rjValeurs résiduelles de Pearson
djvaleurs résiduelles de la somme des carrés d'écart

Bêta du delta (normalisé)

Minitab calcule la variation en supprimant toutes les observations avec la je combinaison de facteurs/covariables. Une valeur est stockée pour chaque combinaison de facteurs/covariables dans les données. Vous pouvez utiliser le β du delta normalisé pour détecter les combinaisons de facteurs/covariables qui influent fortement sur les estimations des coefficients. Cette valeur est fondée sur la valeur résiduelle de Pearson normalisée.

Formule

Notation

TermeDescription
hj effet de levier
rs j valeurs résiduelles normalisées de Pearson

Bêta du delta

Minitab calcule la variation en supprimant toutes les observations avec la je combinaison de facteurs/covariables. Une valeur est stockée pour chaque combinaison de facteurs/covariables dans les données. Vous pouvez utiliser le β du delta pour détecter les combinaisons de facteurs/covariables qui influent fortement sur les estimations des coefficients. Cette valeur est fondée sur la valeur résiduelle de Pearson.

Formule

Notation

TermeDescription
hj effet de levier
rj Valeurs résiduelles de Pearson

Effets de levier

Les effets de levier représentent les éléments diagonaux de la matrice chapeau généralisée. Ils sont utiles pour détecter les combinaisons de facteurs/covariables susceptibles d'avoir une influence significative sur les résultats.

Formule

Notation

TermeDescription
wj je élément diagonal de la matrice de pondération issu de l'ajustement des coefficients
xjje ligne de la matrice du plan
Xmatrice du plan
X'transposition de X
Wmatrice de pondération issue de l'estimation des coefficients

Effets de levier avec validation

Notation

TermeDescription
wi the internal weight for the ie validation row
xithe row of the design matrix for the predictors in the ie validation row
Xthe design matrix for the training data set
X'the transpose of X
Wthe diagonal matrix of internal weights for the training data set

Distance de Cook

Minitab calcule une distance de Cook approximative.

Formule

Notation

TermeDescription
hieffet de levier pour la ie combinaison de facteurs/covariables
valeur résiduelle de Pearson normalisée pour la ie combinaison de facteurs/covariables
pdegrés de liberté de la régression

DFITS

Mesure de l'influence d'une suppression simple sur les valeurs ajustées. Les observations ayant des valeurs DFITS élevées peuvent constituer des valeurs aberrantes. Minitab calcule une valeur approximative pour DFITS.

Formule

Notation

TermeDescription
hiEffet de levier pour le point de données
Valeur résiduelle de Pearson supprimée pour le point de données

Facteur d'inflation de la variance (FIV)

Pour calculer un FIV, réalisez une régression pondérée sur le prédicteur avec les prédicteurs restants. La matrice de pondération correspond à celle fournie dans McCullagh et Nelder1 pour l'estimation des coefficients. Dans ce cas, la formule du FIV est équivalente à celle de la régression linéaire. Par exemple, pour le prédicteur xj, la formule du FIV est la suivante :

Notation

TermeDescription
coefficient de détermination avec xj comme variable de réponse et autres termes du modèle comme prédicteurs

1. P. McCullagh et J.A. Nelder (1989), Generalized Linear Models, 2e édition, Chapman & Hall/CRC, Londres.