Tableau d'analyse de la variance pour Régression par les moindres carrés partiels

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique fournie avec le tableau d'analyse de la variance.

DL

Les degrés de liberté (DL) totaux représentent la quantité d'informations dans vos données. L'analyse utilise ces informations pour estimer les valeurs des paramètres de population inconnus. Les degrés de liberté totaux sont déterminés par le nombre d'observations dans votre échantillon. L'accroissement de l'effectif de l'échantillon permet d'obtenir davantage d'informations sur la population, ce qui augmente les degrés de liberté totaux.

Le DL de la régression indique la quantité d'informations utilisée par les composantes. L'augmentation du nombre de composantes implique d'utiliser plus d'informations, ce qui réduit le DL pour l'erreur. Le DL pour l'erreur résiduelle indique la quantité d'informations disponible pour estimer la variabilité des estimations de paramètres.

Somme des carrés

La somme des carrés (SC), aussi appelée somme des carrés ajustée, correspond aux mesures de variation des différentes composantes du modèle. Minitab divise les sommes des carrés en plusieurs composantes qui décrivent la variation due aux différentes sources.

Régression SC
La régression de la somme des carrés correspond à la somme des écarts au carré des valeurs de réponses ajustées par rapport à la valeur de réponse moyenne. Elle mesure la variation des données de réponse expliquée par le modèle.
Erreur SC
La somme des carrés de l'erreur correspond à la somme des carrés des valeurs résiduelles. Elle quantifie la variation des données non expliquée par les prédicteurs.
Total SC
La somme totale des carrés correspond à la somme des carrés de la régression, plus la somme des carrés de l'erreur. Cela quantifie la variation totale des données.

Interprétation

Minitab utilise la somme des carrés ajustée pour calculer la valeur de p pour un terme. Minitab utilise aussi les sommes des carrés pour calculer la statistique R2. En général, vous interprétez les valeurs de p et la statistique R2 plutôt que les sommes des carrés.

CM

Les carrés moyens (CM), aussi appelés carrés moyens ajustés, mesurent la part de variation expliquée par un terme ou un modèle, en supposant que tous les autres termes sont dans le modèle, quel que soit l'ordre dans lequel ils ont été saisis. Contrairement aux sommes des carrés ajustées, les carrés moyens ajustés tiennent compte des degrés de liberté.

Le carré moyen de l'erreur ajusté (également appelé CME ou s2) est la variance autour des valeurs ajustées.

Interprétation

Minitab utilise les carrés moyens ajustés pour calculer la valeur de p pour un terme. Minitab utilise également les carrés moyens ajustés pour calculer la statistique du R2 ajusté. En général, vous interprétez les valeurs de p et la statistique de R2 ajusté plutôt que les carrés moyens ajustés.

Valeur F

La valeur F est une statistique de test utilisée pour déterminer si le modèle est associé à la réponse.

Interprétation

Minitab utilise la valeur F pour calculer la valeur de p, qui vous permet de déterminer si le modèle est significatif d'un point de vue statistique. La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.

Une valeur F suffisamment élevée indique que le modèle est significatif.

Si vous souhaitez utiliser la valeur F pour savoir si l'hypothèse nulle doit être rejetée, comparez-la à votre valeur critique. Vous pouvez calculer la valeur critique dans Minitab ou rechercher la valeur critique dans un tableau de loi F, disponible dans la plupart des livres de statistiques. Pour plus d'informations sur la façon d'utiliser Minitab pour calculer la valeur critique, accédez à la rubrique Utilisation de la fonction de répartition (CDF) inverse et cliquez sur "Utiliser la CDF inverse pour calculer des valeurs critiques".

Valeur de p – Régression

La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.

Interprétation

Pour déterminer si le modèle explique la variation dans la réponse, comparez la valeur de p du modèle à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle pour la régression globale est que le modèle n'explique en rien la variation dans la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique 5 % de risques de conclure à tort que le modèle explique la variation dans la réponse.
Valeur de p ≤  α : le modèle explique la variation dans la réponse.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez en conclure que le modèle explique la variation dans la réponse.
Valeur de p >  α : vous n'êtes pas en mesure de conclure que le modèle explique la variation dans la réponse.

Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure que le modèle explique la variation dans la réponse. Il est sans doute nécessaire d'ajuster un nouveau modèle.