Qu'est-ce que la régression pondérée ?

La régression pondérée est une méthode pouvant être utilisée lorsque l'hypothèse de variance constante dans les valeurs résiduelles pour les moindres carrés est contredite (hétéroscédasticité). Avec une pondération adaptée, cette procédure minimise la somme des carrés des valeurs résiduelles pondérés, de manière à générer des valeurs résiduelles présentant une variance constante (on parle aussi d'homoscédasticité).

Important

La régression pondérée n'est pas une solution adaptée lorsque l'hétéroscédasticité est due à une variable omise.

Choix de la pondération à utiliser

La détermination de la pondération adaptée à utiliser peut s'avérer une tâche difficile. La pondération idéale correspond à la réciproque de la variance de l'erreur. Elle n'est toutefois généralement pas calculable et d'autres méthodes doivent être utilisées. Ces autres méthodes peuvent faire appel aux éléments suivants :
  • La réciproque d'un prédicteur ou d'un prédicteur au carré si la variance est proportionnelle à un prédicteur. Appuyez-vous sur votre expérience et faites plusieurs essais pour voir ce qui fonctionne.
  • Des valeurs reposant sur la théorie, des documents ou des études précédentes.

En règle générale, les observations ayant de faibles variances présentent des pondérations relativement élevées, et les observations ayant des variances élevées présentent des pondérations relativement faibles.

Supposez que votre modèle de régression prévoit le nombre annuel d'accidents de la route dans différentes villes. Comme les accidents ont tendance à être plus nombreux dans les villes les plus peuplées, les valeurs résiduelles des plus grandes villes ont également tendance à être plus élevées. Pour résoudre ce problème, une méthode consiste à employer la réciproque de la population de chaque ville pour la pondération.

Les pondérations n'influent pas sur les degrés de liberté

La spécification d'une colonne de pondérations n'influe pas sur les degrés de liberté, à moins que vous ne spécifiiez une pondération nulle pour une ou plusieurs observations. L'attribution d'une pondération nulle à une observation entraîne son retrait de l'analyse et, par conséquent, diminue vos degrés de liberté.

La spécification d'une colonne de pondérations influe sur les sommes des carrés et les estimations des paramètres des façons suivantes :
  • Les sommes des carrés deviennent des sommes des carrés pondérés.
  • Une moyenne pondérée est utilisée dans la somme totale des carrés.
  • Un critère des moindres carrés pondérés est utilisé pour estimer les paramètres.

Créer une droite d'ajustement pour la régression linéaire pondérée

Le graphique créé dans les étapes suivantes ne contiendra ni l'équation de régression ni la valeur S, le R carré ou le R carré ajusté, contrairement à la droite d'ajustement créée à l'aide de Stat > Régression > Droite d'ajustement. Toutefois, Minitab affiche ces informations dans les résultats, et vous pouvez les copier et les coller dans le graphique.

Supposons que les réponses se trouvent en C1, les prédicteurs en C2 et les pondérations en C3 :

  1. Sélectionnez Stat > Régression > Régression > Ajuster le modèle de régression
  2. Dans la zone Réponses, saisissez C1. Dans la zone Prédicteurs continus, saisissez C2.
  3. Cliquez sur Options.
  4. Dans la zone Pondérations, saisissez C3. Cliquez sur OK.
  5. Cliquez sur Stockage.
  6. Cochez la case Valeurs ajustées.
  7. Cliquez sur OK dans chaque boîte de dialogue.
  8. Sélectionnez .Graphique > Nuage de points
  9. Cliquez sur Simple. Cliquez sur OK.
  10. Dans la zone variables Y, saisissez C1.
  11. Dans la zone variables X, saisissez C2. Cliquez sur OK.
  12. Cliquez avec le bouton droit de la souris sur le nuage de points et sélectionnez Ajouter > Ligne calculée.
  13. Dans la zone Colonne Y, entrez la colonne de valeurs ajustées (généralement nommée AJUSTEES1).
  14. Dans la zone Colonne X, saisissez C2. Cliquez sur OK.

Changer la couleur de la ligne et le titre du graphique

Vous pouvez modifier la couleur de la droite. Pour afficher la droite en bleu, double-cliquez dessus. Dans l'onglet Attributs, sous Lignes, sélectionnez Personnaliser et sélectionnez la couleur bleue dans la liste déroulante Couleur. Cliquez sur OK.

Vous pouvez également modifier le titre. Double-cliquez sur le titre. Dans l'onglet Police, sous Texte, entrez le titre souhaité. Cliquez sur OK.