Méthodes et formules pour l'analyse de la variance pour la fonction Ajuster le modèle linéaire général

Sélectionnez la méthode ou la formule de votre choix.

Somme des carrés (SomCar)

Pour les matrices, voici les formules pour les différentes sommes des carrés :

Minitab décompose la composante de la somme des carrés de la régression ou des traitements en indiquant la proportion de variation expliquée par chaque terme, en utilisant à la fois la somme des carrés séquentielle et la somme des carrés ajustée.

Notation

TermeDescription
bvecteur des coefficients
Xmatrice du plan
Yvecteur des valeurs de réponse
nnombre d'observations
Jmatrice n sur n de 1s

Somme des carrés séquentielle

Minitab répartit la composante de variance de la somme des carrés de la régression ou des traitements en sommes des carrés séquentielles pour chaque facteur. La somme des carrés séquentielle dépend de l'ordre dans lequel les facteurs ou les prédicteurs sont entrés dans le modèle. La somme des carrés séquentielle est la part de la somme des carrés de la régression expliquée par un facteur unique, en tenant compte de tous les autres facteurs déjà entrés.

Par exemple, dans le cas d'un modèle possédant trois facteurs ou prédicteurs X1, X2 et X3, la somme des carrés séquentielle pour X2 indique la proportion de la variation restante expliquée par X2, sachant que X1 figure déjà dans le modèle. Pour obtenir une séquence de facteurs différente, répétez l'analyse et entrez les facteurs dans un autre ordre.

Somme des carrés ajustée

Les sommes des carrés ajustées ne dépendent pas de l'ordre dans lequel les termes sont entrés dans le modèle. La somme des carrés ajustée est la proportion de variation expliquée par un terme, en tenant compte de tous les autres termes du modèle, indépendamment de l'ordre dans lequel ils ont été entrés.

Par exemple, dans le cas d'un modèle possédant trois facteurs X1, X2, et X3, la somme des carrés ajustée pour X2 indique la proportion de la variation restante expliquée par le terme de X2, du fait que les termes de X1 et X3 figurent également dans le modèle.

Les calculs des sommes des carrés ajustées pour trois facteurs sont les suivants :

  • SCR (X3 | X1, X2) = SCE (X1, X2) - SCE (X1, X2, X3) ou
  • SCR (X3 | X1, X2) = SCR (X1, X2, X3) - SCR (X1, X2)

où SCR (X3 | X1, X2) est la somme des carrés ajustée pour X3, sachant que X1 et X2 figurent dans le modèle.

  • SCR (X2, X3 | X1) = SCE (X1) - SCE (X1, X2, X3) ou
  • SCR (X2, X3 | X1) = SCR (X1, X2, X3) - SCR (X1)

où SCR (X2, X3 | X1) est la somme des carrés ajustée pour X2 et X3, sachant que X1 figure dans le modèle.

Vous pouvez étendre ces formules si votre modèle contient plus de 3 facteurs1.

  1. J. Neter, W. Wasserman and M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Degrés de liberté (DL)

Les degrés de liberté pour chaque composante du modèle sont déterminés comme suit :

Sources de variation DL
Facteur ki – 1
Covariables et interactions entre covariables 1
Interactions impliquant des facteurs
Régression p
Erreur n p – 1
Total n – 1

Si vos données respectent certains critères et que le modèle comprend au moins un prédicteur continu ou plusieurs prédicteurs de catégorie, Minitab utilise certains degrés de liberté pour le test d'inadéquation de l'ajustement. Les critères sont les suivants :
  • Les données contiennent plusieurs observations ayant les mêmes valeurs de prédicteurs.
  • Les données contiennent les points nécessaires à l'estimation des termes supplémentaires ne se trouvant pas dans le modèle.

Notation

TermeDescription
kinombre de niveaux dans le ie facteur
mnombre de facteurs
n nombre d'observations
p nombre de coefficients dans le modèle, constante non incluse

CM ajust - Régression

La formule du carré moyen (CM) de la régression est la suivante :

Notation

TermeDescription
réponse moyenne
ie réponse ajustée
pnombre de termes dans le modèle

CM ajust - Erreur

Le carré moyen de l'erreur (également abrégé en CM Erreur ou CME et noté s2) est la variance autour de la droite de régression. La formule est la suivante :

Notation

TermeDescription
yiie valeur de réponse observée
ième réponse ajustée
nnombre d'observations
pnombre de coefficients dans le modèle, constante non incluse

F

Si tous les facteurs du modèle sont fixes, le calcul de la statistique F dépend de ce sur quoi porte le test d'hypothèse, comme suit :

F(Terme)
F(Inadéquation de l'ajustement)

Si le modèle comporte des facteurs aléatoires, F est calculé à l'aide des informations sur l'espérance mathématique du carré moyen pour chaque terme. Pour plus d'informations, reportez-vous à Neter et al.1.

Notation

TermeDescription
CM ajust Termemesure de la variation expliquée par un terme après la prise en compte des autres termes du modèle
CM Erreurmesure de la variation non expliquée par le modèle
CM Inadéquation de l'ajustementmesure de la variation de la réponse qui peut être modélisée en ajoutant d'autres termes au modèle
CM Erreur puremesure de la variation des données de réponse répliquées
  1. J. Neter, W. Wasserman et M.H. Kutner (1985), Applied Linear Statistical Models, deuxième édition, Irwin, Inc.

Valeur de p - Tableau d'analyse de la variance

La valeur de p est une probabilité calculée à partir d'une loi F avec les degrés de liberté (DL) suivants :

DL en numérateur
somme des degrés de liberté pour le ou les termes du test
DL en dénominateur
degrés de liberté pour l'erreur

Formule

1 − P(Ffj)

Notation

TermeDescription
P(Ff)fonction de répartition de la loi F
fstatistique f pour le test

Test d'inadéquation de l'ajustement pour l'erreur pure

Pour calculer le test d'inadéquation de l'ajustement pour l'erreur pure, Minitab calcule :
  1. La somme des écarts quadratiques de la réponse par rapport à la moyenne dans chaque ensemble de répliques, puis les additionne afin d'obtenir la somme des carrés pour l'erreur pure (SC EP).
  2. Le carré moyen de l'erreur pure

    où n est le nombre d'observations et m le nombre de combinaisons de niveaux x distinctes

  3. La somme des carrés pour l'inadéquation de l'ajustement
  4. Le carré moyen pour l'inadéquation de l'ajustement
  5. Les statistiques de test

Des valeurs de F élevées et de faibles valeurs de p suggèrent que le modèle est inadapté.

Valeur de p - Test d'inadéquation de l'ajustement

Cette valeur de p sert à tester l'hypothèse nulle selon laquelle les coefficients sont nuls pour tous les termes dont l'estimation est possible à partir des données absentes du modèle. La valeur de p est la probabilité issue d'une loi F avec des degrés de liberté (DL) comme suit :
DL en numérateur
degrés de liberté pour l'inéquation de l'ajustement
DL en dénominateur
degrés de liberté pour l'erreur pure

Formule

1 − P(Ffj)

Notation

TermeDescription
P(Ffj)fonction de répartition de la loi F
fjstatistique f pour le test