Minitab calcule trois types de valeurs résiduelles.

Valeurs résiduelles standard

Une valeur résiduelle est la différence entre une valeur observée (y) et la valeur ajustée correspondante ().

Par exemple, ce nuage de points représente le poids de personnes en fonction de leur taille. La droite de régression ajustée représente les valeurs ajustées du poids pour chaque valeur de taille observée. Supposons qu'un homme mesure 1,80 mètres et que la valeur ajustée de son poids soit 86 kg. Si leur poids réel est de 200, la valeur résiduelle est égale à 10.

Créez un graphique des valeurs résiduelles et utilisez d'autres statistiques de diagnostic afin de déterminer si votre modèle est adapté et si les hypothèses de régression sont satisfaites. Les valeurs résiduelles peuvent également montrer à quel point un modèle explique la variation dans les données observées.

Valeurs résiduelles normalisées

La valeur résiduelle normalisée est égale à la valeur résiduelle, ei, divisée par une estimation de son écart type. Les valeurs résiduelles normalisées supérieures à 2 et inférieures à -2 sont généralement considérées comme importantes et Minitab ajoute un "R" à ces observations dans le tableau des observations aberrantes, ainsi que dans le tableau des valeurs ajustées et résiduelles. Les observations signalées par Minitab suivent mal l'équation de régression proposée. Toutefois, il est normal d'obtenir quelques observations aberrantes. Par exemple, selon les critères utilisés pour définir des valeurs résiduelles normalisées élevées, vous pouvez vous attendre à ce qu'environ 5 % de vos observations soient signalées pour leur valeur résiduelle normalisée importante.

Utilisez les valeurs résiduelles normalisées pour détecter les valeurs aberrantes. Les valeurs résiduelles normalisées sont utiles car les valeurs résiduelles brutes peuvent ne pas identifier de façon correcte les valeurs aberrantes lorsque celles-ci présentent une variance non constante. Si des valeurs résiduelles dont les valeurs de x sont éloignées de ont une variance plus élevée que celles dont les valeurs de x sont proches de , les valeurs aberrantes sont plus difficiles à détecter. La normalisation contrôle cette variance non constante et toutes les valeurs résiduelles normalisées ont le même écart type.

Les valeurs résiduelles normalisées sont également appelées valeurs résiduelles studentisées en interne.

Valeurs résiduelles studentisées

La valeur résiduelle supprimée studentisée d'une observation est la division de la valeur résiduelle supprimée d'une observation par une estimation de son écart type. Une valeur résiduelle supprimée di est la différence entre yi et sa valeur ajustée dans un modèle qui omet la ie observation dans ses calculs. L'omission de l'observation permet de déterminer le comportement du modèle sans cette valeur aberrante potentielle. Si une observation possède une valeur résiduelle supprimée studentisée élevée (si sa valeur absolue est supérieure à 2), il peut s'agir d'une valeur aberrante dans les données.

Utilisez les valeurs résiduelles supprimées pour détecter les valeurs aberrantes. Les valeurs résiduelles supprimées sont utiles car les valeurs résiduelles brutes peuvent ne pas identifier de façon correcte les valeurs aberrantes lorsque celles-ci présentent une variance non constante. Si des valeurs résiduelles dont les valeurs de x sont éloignées de ont une variance plus élevée que celles dont les valeurs de x sont proches de , les valeurs aberrantes sont plus difficiles à détecter. Toutes les valeurs résiduelles supprimées présentent le même écart type.

Chaque valeur résiduelle supprimée studentisée suit la loi t avec (n – 1 – p) degrés de liberté, où p représente le nombre de termes dans le modèle de régression.

Les valeurs résiduelles supprimées studentisées sont également appelées valeurs résiduelles studentisées de manière externe ou valeurs résiduelles studentisées.