Méthodes et formules pour les mesures de diagnostic pour la fonction Ajuster le modèle linéaire général

Sélectionnez la méthode ou la formule de votre choix.

Effets de levier (Hi)

Les effets de levier sont obtenus à partir de la matrice H, qui est une matrice de projection n x n :

L'effet de levier de la ie observation est le ie élément diagonal, hi de H. Si la valeur de hi est élevée, la ie observation contient des prédicteurs aberrants (X1i, X2i, ..., Xpi). En d'autres termes, les valeurs de prédicteurs sont éloignées du vecteur de moyenne, avec distance de Mahalanobis.

Les valeurs à effet de levier sont comprises entre 0 et 1. Dans le tableau des observations aberrantes, Minitab affecte un X aux observations qui présentent soit des effets de levier supérieurs à 3 p/n soit la valeur 0,99, en considérant en priorité la plus petite de ces valeurs. Généralement, vous examinez des valeurs à fort effet de levier.

Notation

TermeDescription
Xmatrice du plan
hiie élément sur la diagonale de la matrice H
pnombre de termes dans le modèle, constante incluse
nnombre d'observations

Distance de Cook

Mesure globale, D, de l'impact combiné dans tous les coefficients de régression estimés sur une observation. Minitab calcule D à l'aide des valeurs à effet de levier et des valeurs résiduelles normalisées, puis détermine si une observation est aberrante à la fois au regard des valeurs de X et de Y. Les observations dont les valeurs de D sont élevées peuvent être des valeurs aberrantes.

Formule

La distance de Cook est la distance entre les coefficients calculés avec et sans l'ie observation. Minitab calcule la distance de Cook sans ajuster de nouvelle équation de régression à chaque fois qu'une observation est omise. Le calcul est le suivant :

Notation

TermeDescription
ei ie valeur résiduelle
hi ie élément sur la diagonale de
p nombre de paramètres de modèle, constante incluse
s 2 carré moyen de l'erreur
b vecteur de coefficients
b(i) vecteur de coefficients calculé après la suppression de l'ie observation
X matrice du plan

DFITS

Combine l'effet de levier et les valeurs résiduelles studentisées pour fournir une mesure globale du caractère aberrant d'une observation. DFITS mesure l'influence de chaque observation sur les valeurs ajustées dans un modèle de régression et d'ANOVA. Les observations présentant des valeurs DFITS élevées peuvent être des valeurs aberrantes.

DFITS exprime approximativement le changement, en nombre d'écarts types, de la valeur ajustée lorsque chaque observation est supprimée de l'ensemble de données et que le modèle est réajusté. Minitab peut également calculer la valeur DFITS sans ajuster de nouvelle équation de régression à chaque fois qu'une observation est omise.

Formule

Notation

TermeDescription
ei ie valeur résiduelle
hi ie élément sur la diagonale de
X matrice du plan
ie réponse ajustée
valeur ajustée calculée sans l'ie observation
CME (i) carré moyen de l'erreur calculé sans l'ie observation
n nombre d'observations
p nombre de paramètres de modèle