Qu'est-ce que la somme des carrés ?

La somme des carrés est une mesure de variation ou d'écart par rapport à la moyenne. Elle représente la somme des carrés des différences par rapport à la moyenne. Le calcul de la somme totale des carrés prend en compte les différences dues aux facteurs et de celles dues au hasard ou à l'erreur.

Sommes des carrés dans une ANOVA

Dans l'analyse de variance (ANOVA), la somme totale des carrés permet d'exprimer la variation totale attribuable aux différents facteurs. Par exemple, vous pouvez mener une expérience afin de tester l'efficacité de trois détergents de blanchisserie.

Somme totale de carrés = somme des carrés des traitements (SCT) + somme des carrés de l'erreur résiduelle (SCE)

La somme des carrés des traitements est la variation attribuée aux détergents de blanchisserie (ou, en l'occurrence, la variation entre les détergents). La somme des carrés de l'erreur résiduelle est la variation attribuée à l'erreur.

La conversion de la somme des carrés en carrés moyens en effectuant une division par les degrés de liberté permet de comparer ces rapports et de déterminer s'il existe une différence significative due au détergent. Plus ce rapport est élevé, plus les traitements affectent le résultat.

Somme des carrés dans une régression

Dans une régression, la somme totale des carrés permet d'exprimer la variation totale des  y. Par exemple, vous collectez des données afin de déterminer un modèle expliquant les ventes totales en fonction de votre budget publicitaire.

Somme totale de carrés = somme des carrés de la régression (SCR) + somme des carrés de l'erreur résiduelle (SCER)

La somme des carrés de la régression est la variation attribuée à la relation entre les x et les y, en l'occurrence entre le budget publicitaire et les ventes. La somme des carrés de l'erreur résiduelle est la variation attribuée à l'erreur.

La comparaison de la somme des carrés de la régression à la somme totale des carrés indique la proportion de la variation totale expliquée par le modèle de régression (R2, coefficient de détermination). Plus cette valeur est élevée, meilleure est la relation expliquant les ventes en tant que fonction du budget publicitaire.

Comparaison des sommes des carrés séquentielles et ajustées

Minitab répartit la composante de variance de la somme des carrés de la régression ou des traitements en sommes des carrés pour chaque facteur.
Sommes des carrés séquentielles

La somme des carrés séquentielle dépend de l'ordre dans lequel les facteurs sont entrés dans le modèle. Il s'agit de la part de la somme des carrés de la régression expliquée par un facteur unique, en fonction de tous les autres facteurs déjà entrés.

Par exemple, dans le cas d'un modèle possédant trois facteurs X1, X2 et X3, la somme des carrés séquentielle pour X2 indique la proportion de la variation restante expliquée par X2, du fait que X1 figure déjà dans le modèle. Pour obtenir une séquence de facteurs différente, répétez la procédure de régression en entrant les facteurs dans un autre ordre.

Sommes des carrés ajustées

Les sommes des carrés ajustées ne dépendent pas de l'ordre dans lequel les facteurs sont entrés dans le modèle. Il s'agit de la part de la somme des carrés de la régression expliquée par un facteur unique, en fonction de tous les autres facteurs du modèle, indépendamment de l'ordre dans lequel ils ont été entrés dans celui-ci.

Par exemple, dans le cas d'un modèle possédant trois facteurs X1, X2, et X3, la somme des carrés ajustée pour X2 indique la proportion de la variation restante expliquée par X2, du fait que X1 et X3 figurent également dans le modèle.

A quel moment les sommes des carrés séquentielles et ajustées sont-elles identiques  ?

Les sommes des carrés séquentielles et ajustées sont toujours identiques pour le dernier terme du modèle. Par exemple, si votre modèle contient les termes A, B et C (dans cet ordre), les sommes des carrés pour  C représentent dans les deux cas la réduction de la somme des carrés de l'erreur résiduelle qui survient lorsque C est ajouté au modèle contenant A et B.

Les sommes des carrés séquentielles et ajustées seront identiques pour tous les termes si la matrice du plan est orthogonale. Les plans factoriels et factoriels fractionnaires (sans covariables) sont les cas les plus courants lorsqu'ils sont analysés en unités codées. Dans ces plans, les colonnes de la matrice de plan de tous les effets principaux et interactions sont orthogonales les unes par rapport aux autres. Dans les plans de Plackett-Burman, les colonnes des effets principaux (généralement les seuls termes du modèle) sont orthogonales, mais les termes d'interaction, lorsqu'il y en a, peuvent être partiellement confondus avec d'autres termes (c'est-à-dire, non orthogonaux). Dans les plans de surface de réponse, les colonnes des termes quadratiques ne sont pas orthogonales les unes par rapport aux autres.

Pour tout plan, si la matrice de plan est en unités non codées, certaines colonnes peuvent ne pas être orthogonales, à moins que les niveaux de facteurs ne soient encore centrés sur zéro.

Les sommes des carrés ajustées peuvent-elles être inférieures, égales ou supérieures aux sommes des carrés séquentielles  ?

Les sommes des carrés ajustées peuvent être inférieures, égales ou supérieures aux sommes des carrés séquentielles.

Supposons que vous ajustiez un modèle avec les termes A, B, C et A*B. Considérons que SC(A, B, C, A*B) représente la somme des carrés lorsque les termes A, B, C et A*B se trouvent dans le modèle. Considérons que SC(A, B, C) représente la somme des carrés lorsque les termes A, B et C se trouvent dans le modèle. La somme des carrés ajustées pour A*B est la suivante : 

SC(A, B, C, A*B) - SC(A, B, C)

Toutefois, en incluant les mêmes termes A, B, C et A*B dans le modèle, la somme des carrés séquentielle pour A*B dépend de l'ordre dans lequel les termes sont spécifiés dans le modèle.

En utilisant une notation similaire, si l'ordre est A, B, A*B, C, la somme des carrés séquentielle pour A*B est la suivante : 

SC(A, B, A*B) - SC(A, B)

Selon les données et l'ordre de saisie des termes, tous les cas suivants sont possibles :
  • SC(A, B, C, A*B) - SC(A, B, C) < SC(A, B, A*B) - SC(A, B), ou
  • SC(A, B, C, A*B) - SC(A, B, C) = SC(A, B, A*B) - SC(A, B), ou
  • SC(A, B, C, A*B) - SC(A, B, C) > SC(A, B, A*B) - SC(A, B)

Qu'est-ce que la somme des carrés non corrigée ?

Cette fonction permet d'élever chaque valeur de la colonne au carré et de calculer la somme de ces carrés. En d'autres termes, si la colonne contient x1, x2, ... , xn, la somme des carrés est égale à (x1 + x2 + ... + xn2). A la différence de la somme des carrés corrigée, la somme des carrés non corrigée inclut l'erreur. Les valeurs sont élevées au carré sans soustraction préalable de la moyenne.

Dans Minitab, vous pouvez utiliser des statistiques descriptives pour afficher la somme des carrés non corrigée. Vous pouvez également utiliser la fonction de somme des carrés (S CARRES) de la calculatrice pour calculer la somme des carrés non corrigée d'une colonne ou d'une ligne. Par exemple, vous calculez une formule manuellement et souhaitez obtenir la somme des carrés pour un ensemble de variables de réponse (y).

Dans la calculatrice, entrez l'expression S CARRES (C1).

Stockez les résultats en C2 pour voir la somme des carrés non corrigée. La feuille de travail suivante présente les résultats du calcul de la somme des carrés de la colonne  y à l'aide de la calculatrice.

C1 C2
y Somme des carrés
2,40 41,5304
4,60  
2,50  
1,60  
2,20  
0,98  
Remarque

Minitab omet les valeurs manquantes du calcul de cette fonction.