Que sont les carrés moyens ?

Les carrés moyens sont une estimation de la variance de la population. Cette valeur est la division de la somme correspondante des carrés par les degrés de liberté.

Régression

Dans la régression, les carrés moyens permettent de déterminer si les termes du modèle sont significatifs.
  • Le carré moyen du terme est la division de la somme des carrés des termes par les degrés de liberté.
  • Le carré moyen de l'erreur (CA MOY ERR) s'obtient en divisant la somme des carrés de l'erreur résiduelle par le nombre de degrés de liberté. Le carré moyen de l'erreur est la variance (s2) autour de la droite de régression.

La division de CM(terme) par CM(erreur) donne F, qui suit la loi F avec des degrés de liberté pour le terme et des degrés de liberté pour l'erreur.

ANOVA

Dans l'ANOVA, les carrés moyens permettent de déterminer si les facteurs (traitements) sont significatifs.
  • Le carré moyen des traitements est la division de la somme des carrés des traitements par les degrés de liberté. Le carré moyen des traitements représente la variation entre les moyennes des échantillons.
  • Le carré moyen de l'erreur (CA MOY ERR) s'obtient en divisant la somme des carrés de l'erreur résiduelle par le nombre de degrés de liberté. Le carré moyen de l'erreur représente la variation à l'intérieur des échantillons.

Par exemple, vous pouvez mener une expérience afin de tester l'efficacité de trois détergents de blanchisserie. Vous collectez 20 observations pour chaque détergent. La variation dans les moyennes entre les détergents 1, 2 et 3 est représentée par le carré moyen du traitement. La variation à l'intérieur des échantillons est représentée par le carré moyen de l'erreur.

Que sont les carrés moyens ajustés ?

Les carrés moyens ajustés sont la somme des carrés ajustée divisée par les degrés de liberté. La somme des carrés ajustée ne dépend pas de l'ordre dans lequel les facteurs sont entrés dans le modèle. Il s'agit de la part de la somme des carrés de la régression expliquée par un facteur unique, en prenant en compte tous les autres facteurs du modèle, indépendamment de l'ordre dans lequel ils ont été entrés dans celui-ci.

Par exemple, dans le cas d'un modèle possédant trois facteurs X1, X2 et X3, la somme des carrés ajustée pour X2 indique la proportion de la variation restante expliquée par X2, en partant du principe que X1 et X3 figurent également dans le modèle.

Qu'est-ce que l'espérance mathématique des carrés moyens ?

Si vous ne spécifiez aucun facteur comme étant aléatoire, Minitab suppose que tous les facteurs sont fixes. Dans ce cas, le dénominateur pour la statistique F sera égal à l'erreur quadratique moyenne. Toutefois, pour les modèles comprenant des termes aléatoires, l'erreur quadratique moyenne n'est pas toujours le terme d'erreur correct. Vous pouvez examiner l'espérance mathématique des carrés moyens pour déterminer le terme d'erreur qui était utilisé dans le test F.

Lorsque vous sélectionnez Modèle linéaire général, Minitab affiche un tableau de l'espérance mathématique des carrés moyens, des composantes estimées de la variance et du terme de l'erreur (carrés moyens du dénominateur) utilisé dans chaque test F par défaut. L'espérance mathématique des carrés moyens est égale à l'espérance mathématique de ces termes avec le modèle spécifié. S'il n'existe pas de test F exact pour un terme, Minitab propose une solution pour le terme d'erreur adapté de manière à construire une approximation du test F. Ce test se nomme test synthétique.

L'estimation des composantes de la variance est égale aux estimations sans biais issues de l'ANOVA. Celles-ci s'obtiennent en fixant la valeur de chaque carré moyen calculé à son espérance mathématique, ce qui donne un système d'équations linéaires dont les inconnues, qui sont les composantes de la variance, s'obtiennent par sa résolution. Malheureusement, cette méthode peut donner des estimations négatives, qu'il faut alors fixer à zéro. Minitab, cependant, affiche les estimations négatives parce qu'elles indiquent parfois que le modèle ajusté n'est pas adapté pour les données. Il n'y a pas d'estimation des composantes de la variance pour les termes fixes.