Créer une droite d'ajustement et un modèle de régression passant par l'origine

Par défaut, Minitab inclut un terme constant pour les droites d'ajustement et les modèles de régression. Pour supprimer ce terme et faire passer le modèle par l'origine, suivez ces étapes.

Créer une droite d'ajustement passant par l'origine

Supposons que la variable de prévision (X) se trouve en C1 et la variable de réponse (Y) en C2.

  1. Sélectionnez Graphique > Nuage de points > Avec régression.
  2. Sous variables Y, saisissez C2. Sous variables X, saisissez C1.
  3. Cliquez sur Visualisation des données, puis sélectionnez l'onglet Régression.
  4. Décochez Ajuster l'ordonnée à l'origine. Cliquez sur OK dans chaque boîte de dialogue.

Créer un modèle de régression passant par l'origine

Supposons que la variable de prédiction (X) se trouve en C1 et la variable de réponse (Y) en C2.

  1. Sélectionnez Stat > Régression > Régression > Ajuster le modèle de régression.
  2. Sous Réponses, saisissez C2. Sous Prédicteurs continus, saisissez C1.
  3. Cliquez sur Modèle, puis décochez Inclure le terme constant dans le modèle.
  4. Cliquez sur OK dans chaque boîte de dialogue.

Lorsque Minitab ajuste le modèle avec le terme constant, le R carré est la proportion de la variation d'origine, telle que mesurée par la somme des carrés par rapport à la moyenne de Y, expliquée par la régression. Pour le modèle sans terme constant, le R carré est la proportion de la variation par rapport à l'origine (c'est-à-dire, autour de la valeur zéro) expliquée par la régression. Cela signifie que les valeurs de R carré pour les modèles avec et sans ordonnée à l'origine ne sont pas comparables.

Plus spécifiquement, le R carré de la régression passant par l'origine a tendance à être plus élevé que celui de la régression avec une ordonnée à l'origine, même si la qualité de l'ajustement n'est pas meilleure. Le modèle avec ordonnée à l'origine calcule les variations dans le numérateur (SCrég) et le dénominateur (SCtotal) du R carré par rapport à la moyenne de la réponse, tandis que dans le modèle sans ordonnée à l'origine, ces variations sont calculées par rapport à zéro. De telles statistiques ne peuvent pas être utilisées à des fins de comparaison de performances avec le modèle avec ordonnée à l'origine, car le R carré du modèle sans ordonnée à l'origine a tendance à être plus élevé que celui du modèle avec ordonnée à l'origine. Cela s'explique par l'utilisation de sommes des carrés non corrigées (par rapport à zéro). Si le R carré est calculé par rapport à la moyenne de la réponse dans le modèle sans ordonnée à l'origine, il peut parfois être négatif.