Pour les matrices, voici les formules pour les différentes sommes des carrés :
Minitab décompose la composante de la somme des carrés de la régression ou des traitements en indiquant la proportion de variation expliquée par chaque terme, en utilisant à la fois la somme des carrés séquentielle et la somme des carrés ajustée.
Terme | Description |
---|---|
b | vecteur des coefficients |
X | matrice du plan |
Y | vecteur des valeurs de réponse |
n | nombre d'observations |
J | matrice n sur n de 1s |
Minitab répartit la composante de variance de la somme des carrés de la régression ou des traitements en sommes des carrés séquentielles pour chaque facteur. La somme des carrés séquentielle dépend de l'ordre dans lequel les facteurs ou les prédicteurs sont entrés dans le modèle. La somme des carrés séquentielle est la part de la somme des carrés de la régression expliquée par un facteur unique, en tenant compte de tous les autres facteurs déjà entrés.
Par exemple, dans le cas d'un modèle possédant trois facteurs ou prédicteurs X1, X2 et X3, la somme des carrés séquentielle pour X2 indique la proportion de la variation restante expliquée par X2, sachant que X1 figure déjà dans le modèle. Pour obtenir une séquence de facteurs différente, répétez l'analyse et entrez les facteurs dans un autre ordre.
Les sommes des carrés ajustées ne dépendent pas de l'ordre dans lequel les termes sont entrés dans le modèle. La somme des carrés ajustée est la proportion de variation expliquée par un terme, en tenant compte de tous les autres termes du modèle, indépendamment de l'ordre dans lequel ils ont été entrés.
Par exemple, dans le cas d'un modèle possédant trois facteurs X1, X2, et X3, la somme des carrés ajustée pour X2 indique la proportion de la variation restante expliquée par le terme de X2, du fait que les termes de X1 et X3 figurent également dans le modèle.
Les calculs des sommes des carrés ajustées pour trois facteurs sont les suivants :
où SCR (X3 | X1, X2) est la somme des carrés ajustée pour X3, sachant que X1 et X2 figurent dans le modèle.
où SCR (X2, X3 | X1) est la somme des carrés ajustée pour X2 et X3, sachant que X1 figure dans le modèle.
Vous pouvez étendre ces formules si votre modèle contient plus de 3 facteurs1.
Les degrés de liberté pour chaque composante du modèle sont déterminés comme suit :
Sources de variation | DL |
---|---|
Facteur | ki – 1 |
Covariables et interactions entre covariables | 1 |
Interactions impliquant des facteurs | |
Régression | p |
Erreur | n – p – 1 |
Total | n – 1 |
Terme | Description |
---|---|
ki | nombre de niveaux dans le ie facteur |
m | nombre de facteurs |
n | nombre d'observations |
p | nombre de coefficients dans le modèle, constante non incluse |
La formule du carré moyen (CM) de la régression est la suivante :
Terme | Description |
---|---|
réponse moyenne | |
ie réponse ajustée | |
p | nombre de termes dans le modèle |
Le carré moyen de l'erreur (également abrégé en CM Erreur ou CME et noté s2) est la variance autour de la droite de régression. La formule est la suivante :
Terme | Description |
---|---|
yi | ie valeur de réponse observée |
ième réponse ajustée | |
n | nombre d'observations |
p | nombre de coefficients dans le modèle, constante non incluse |
Si tous les facteurs du modèle sont fixes, le calcul de la statistique F dépend de ce sur quoi porte le test d'hypothèse, comme suit :
Si le modèle comporte des facteurs aléatoires, F est calculé à l'aide des informations sur l'espérance mathématique du carré moyen pour chaque terme. Pour plus d'informations, reportez-vous à Neter et al.1.
Terme | Description |
---|---|
CM ajust Terme | mesure de la variation expliquée par un terme après la prise en compte des autres termes du modèle |
CM Erreur | mesure de la variation non expliquée par le modèle |
CM Inadéquation de l'ajustement | mesure de la variation de la réponse qui peut être modélisée en ajoutant d'autres termes au modèle |
CM Erreur pure | mesure de la variation des données de réponse répliquées |
La valeur de p est une probabilité calculée à partir d'une loi F avec les degrés de liberté (DL) suivants :
1 − P(F ≤ fj)
Terme | Description |
---|---|
P(F ≤ f) | fonction de répartition de la loi F |
f | statistique f pour le test |
où n est le nombre d'observations et m le nombre de combinaisons de niveaux x distinctes
Des valeurs de F élevées et de faibles valeurs de p suggèrent que le modèle est inadapté.
1 − P(F ≤ fj)
Terme | Description |
---|---|
P(F ≤ fj) | fonction de répartition de la loi F |
fj | statistique f pour le test |