Méthodes et formules pour l'analyse de la variance pour la fonction Analyser la variabilité

Sur ce thème

Somme des carrés (SomCar)
Somme des carrés séquentielle
Somme des carrés ajustée
Degrés de liberté (DL)
CM ajust - Terme
F
Valeur de p - Tableau d'analyse de la variance
Test d'inadéquation de l'ajustement pour l'erreur pure
Valeur de p - Test d'inadéquation de l'ajustement

Somme des carrés (SomCar)

Somme des carrés des distances. Les formules présentées sont destinées à un modèle factoriel complet à 2 facteurs comportant les facteurs A et B. Ces formules peuvent être étendues à des modèles comportant plus de 2 facteurs. Pour plus d'informations, reportez-vous à Montgomery¹.

La somme des carrés totale est la variation totale dans le modèle. SC (A) et SC (B) représentent la somme des écarts quadratiques des moyennes estimées des niveaux de facteurs par rapport à la moyenne globale. La somme des carrés de l'erreur (SC Erreur) est la somme des carrés des valeurs résiduelles. Cette valeur est également appelée erreur entre les traitements. Les calculs sont les suivants :

Si le modèle comporte des répliques, la somme des carrés de l'erreur pure est calculée comme suit :

Pour les cas autres que le modèle factoriel complet à 2 facteurs, vous pouvez utiliser une autre somme des carrés. Si vous ajustez un modèle réduit, de la somme des carrés pour l'inadéquation de l'ajustement est calculée comme suit :

Si le modèle comprend des points centraux, la somme des carrés pour la courbure est calculée comme suit :

Dans les plans en parcelles divisées, les sommes des carrés pour la variation de l'erreur de sous-bloc et de sous-parcelle sont calculés comme suit :

D.C. Montgomery (1991), Design and Analysis of Experiments, troisième édition, John Wiley & Sons.

Notation

Terme	Description
a	nombre de niveaux dans le facteur A
b	nombre de niveaux dans le facteur B
n	nombre total de répliques
	moyenne de l'i^e niveau du facteur A
	moyenne globale de toutes les observations
	moyenne du j^e niveau du facteur B
	observation au i^e niveau du facteur A, du j^e niveau du facteur B et de la k^e réplique
	moyenne de l'i^e niveau du facteur A et du j^e niveau du facteur B
	réponse moyenne pour les points centraux
	réponse moyenne pour les points factoriels
n_F	nombre de points factoriels

Somme des carrés séquentielle

Minitab répartit la composante de variance de la somme des carrés de la régression ou des traitements en sommes des carrés séquentielles pour chaque facteur. La somme des carrés séquentielle dépend de l'ordre dans lequel les facteurs ou les prédicteurs sont entrés dans le modèle. La somme des carrés séquentielle est la part de la somme des carrés de la régression expliquée par un facteur unique, en tenant compte de tous les autres facteurs déjà entrés.

Par exemple, dans le cas d'un modèle possédant trois facteurs ou prédicteurs X1, X2 et X3, la somme des carrés séquentielle pour X2 indique la proportion de la variation restante expliquée par X2, sachant que X1 figure déjà dans le modèle. Pour obtenir une séquence de facteurs différente, répétez l'analyse et entrez les facteurs dans un autre ordre.

Somme des carrés ajustée

Les sommes des carrés ajustées ne dépendent pas de l'ordre dans lequel les termes sont entrés dans le modèle. La somme des carrés ajustée est la proportion de variation expliquée par un terme, en tenant compte de tous les autres termes du modèle, indépendamment de l'ordre dans lequel ils ont été entrés.

Par exemple, dans le cas d'un modèle possédant trois facteurs X1, X2, et X3, la somme des carrés ajustée pour X2 indique la proportion de la variation restante expliquée par le terme de X2, du fait que les termes de X1 et X3 figurent également dans le modèle.

Les calculs des sommes des carrés ajustées pour trois facteurs sont les suivants :

SCR (X3 | X1, X2) = SCE (X1, X2) - SCE (X1, X2, X3) ou
SCR (X3 | X1, X2) = SCR (X1, X2, X3) - SCR (X1, X2)

où SCR (X3 | X1, X2) est la somme des carrés ajustée pour X3, sachant que X1 et X2 figurent dans le modèle.

SCR (X2, X3 | X1) = SCE (X1) - SCE (X1, X2, X3) ou
SCR (X2, X3 | X1) = SCR (X1, X2, X3) - SCR (X1)

où SCR (X2, X3 | X1) est la somme des carrés ajustée pour X2 et X3, sachant que X1 figure dans le modèle.

Vous pouvez étendre ces formules si votre modèle contient plus de 3 facteurs¹.

J. Neter, W. Wasserman and M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Degrés de liberté (DL)

Pour un plan factoriel complet comportant les facteurs A et B, ainsi qu'une variable de blocage, le nombre de degrés de liberté associé à chaque somme des carrés est calculé comme suit :

Pour les interactions entre les facteurs, multipliez les degrés de liberté des facteurs du terme. Par exemple, si les facteurs sont A et B, les degrés de liberté de l'interaction AB sont calculés comme suit :

Pour calculer les degrés de liberté d'un type de terme, additionnez les degrés de liberté des termes. Par exemple, si les facteurs sont A et B, les effets principaux dans le modèle ont le nombre suivant de degrés de liberté :

Pour les plans à deux niveaux avec des points centraux, le nombre de degrés de libertés pour la courbure est de 1.

Notation

Terme	Description
a	nombre de niveaux dans le facteur A
b	nombre de niveaux dans le facteur B
c	nombre de blocs
n	nombre total d'observations
n_i	nombre d'observations pour l'i^e combinaison de niveaux de facteurs
m	nombre de combinaisons de niveaux de facteurs
p	nombre de coefficients

CM ajust - Terme

Le calcul du carré moyen (CM) pour le terme de modèle est le suivant :

F

Test permettant de déterminer si les effets principaux et les effets d'interaction sont significatifs. La formule des termes du modèle est la suivante :

Les degrés de liberté du test sont calculés comme suit :

Numérateur = degrés de liberté du terme
Dénominateur = degrés de liberté de l'erreur

Une valeur élevée de F est une indication en faveur du rejet de l'hypothèse nulle selon laquelle il n'existe aucun effet significatif.

Pour les plans en parcelles divisées équilibrés, la statistique F des facteurs difficiles à changer utilise le CM de l'erreur de sous-bloc comme dénominateur. Pour les autres plans en parcelles divisées, Minitab utilise une combinaison linéaire des erreurs SB et SP afin de créer un dénominateur reposant sur l'espérance mathématique des carrés moyens.

Valeur de p - Tableau d'analyse de la variance

La valeur de p est une probabilité calculée à partir d'une loi F avec les degrés de liberté (DL) suivants :

DL en numérateur: somme des degrés de liberté pour le ou les termes du test
DL en dénominateur: degrés de liberté pour l'erreur

Formule

1 − P(F ≤ f_j)

Notation

Terme	Description
P(F ≤ f)	fonction de répartition de la loi F
f	statistique f pour le test

Test d'inadéquation de l'ajustement pour l'erreur pure

Pour calculer le test d'inadéquation de l'ajustement pour l'erreur pure, Minitab calcule :

La somme des écarts quadratiques de la réponse par rapport à la moyenne dans chaque ensemble de répliques, puis les additionne afin d'obtenir la somme des carrés pour l'erreur pure (SC EP).
Le carré moyen de l'erreur pure

où n est le nombre d'observations et m le nombre de combinaisons de niveaux x distinctes
La somme des carrés pour l'inadéquation de l'ajustement
Le carré moyen pour l'inadéquation de l'ajustement
Les statistiques de test

Des valeurs de F élevées et de faibles valeurs de p suggèrent que le modèle est inadapté.

Valeur de p - Test d'inadéquation de l'ajustement

Cette valeur de p sert à tester l'hypothèse nulle selon laquelle les coefficients sont nuls pour tous les termes dont l'estimation est possible à partir des données absentes du modèle. La valeur de p est la probabilité issue d'une loi F avec des degrés de liberté (DL) comme suit :

DL en numérateur: degrés de liberté pour l'inéquation de l'ajustement
DL en dénominateur: degrés de liberté pour l'erreur pure

Formule

1 − P(F ≤ f_j)

Notation

Terme	Description
P(F ≤ f_j)	fonction de répartition de la loi F
f_j	statistique f pour le test