Valider les hypothèses du modèle dans la régression ou l'analyse ANOVA

Une régression ou une ANOVA ne s'arrêtent pas lorsque le modèle est ajusté. Vous devez examiner les graphiques des valeurs résiduelles et les autres statistiques de diagnostic, afin de déterminer si le modèle est adapté et si les hypothèses de régression sont satisfaites. Si votre modèle n'est pas adapté, vos données seront représentées de façon incorrecte. Par exemple :
  • Les erreurs types des coefficients peuvent être biaisées, ce qui génère des valeurs de t et de p incorrectes.
  • Les coefficients peuvent porter le mauvais signe.
  • Le modèle peut être influencé par un ou deux points.
Utilisez le tableau suivant pour déterminer si votre modèle est adapté.
Caractéristiques d'un modèle de régression adapté Méthode de vérification Solutions possibles
La forme fonctionnelle modélise chaque courbure présente avec précision.

Test d'inadéquation de l'ajustement

Diagramme des valeurs résiduelles en fonction des variables

Ajouter un terme d'ordre supérieur au modèle

Transformer les variables

Régression non linéaire

Les valeurs résiduelles présentent une variance constante.

Diagramme des valeurs résiduelles en fonction des valeurs ajustées

Transformer les variables

Moindres carrés pondérés

Les valeurs résiduelles sont indépendantes les unes des autres (non corrélées).

Statistique de Durbin-Watson

Diagramme des valeurs résiduelles en fonction de l'ordre

Ajouter un nouveau prédicteur

Utiliser l'analyse des séries chronologiques

Ajouter une variable de décalage

Les valeurs résiduelles ont une distribution normale.

Histogramme des valeurs résiduelles

Droite de Henry des valeurs résiduelles

Diagramme des valeurs résiduelles en fonction des valeurs ajustées

Test de normalité

Transformer les variables

Rechercher les valeurs aberrantes

Aucune observation anormale ni valeur aberrante.

Graphiques des valeurs résiduelles

Effets de levier

Distance de Cook

DFITS

Transformer les variables

Supprimer l'observation aberrante

Les données ne sont pas mal conditionnées.

Facteurs d'inflation de la variance (FIV)

Matrice de corrélation des prédicteurs

Supprimer le prédicteur

Droite de régression par les moindres carrés partiels

Transformer les variables

Déterminer les raisons pour lesquelles un modèle ne satisfait pas aux hypothèses

S'il s'avère que votre modèle ne satisfait pas aux critères répertoriés ci-dessus, vous devez :
  1. Déterminer si les données ont été saisies correctement, notamment les observations identifiées comme étant anormales.
  2. Essayer de déterminer la cause du problème. Il peut être judicieux de déterminer la sensibilité de votre modèle au problème. Par exemple, s'il existe une valeur aberrante, vous pouvez effectuer l'analyse de régression sans cette observation, puis comparer les résultats.
  3. Essayez d'appliquer l'une des solutions répertoriées ci-dessus.