Pour les matrices, voici les formules pour les différentes sommes des carrés :
Minitab décompose la composante de la somme des carrés de la régression ou des traitements en indiquant la proportion de variation expliquée par chaque terme, en utilisant à la fois la somme des carrés séquentielle et la somme des carrés ajustée.
Terme | Description |
---|---|
b | vecteur des coefficients |
X | matrice du plan |
Y | vecteur des valeurs de réponse |
n | nombre d'observations |
J | matrice n sur n de 1s |
Minitab répartit la composante de variance de la somme des carrés de la régression ou des traitements en sommes des carrés séquentielles pour chaque facteur. La somme des carrés séquentielle dépend de l'ordre dans lequel les facteurs ou les prédicteurs sont entrés dans le modèle. La somme des carrés séquentielle est la part de la somme des carrés de la régression expliquée par un facteur unique, en tenant compte de tous les autres facteurs déjà entrés.
Par exemple, dans le cas d'un modèle possédant trois facteurs ou prédicteurs X1, X2 et X3, la somme des carrés séquentielle pour X2 indique la proportion de la variation restante expliquée par X2, sachant que X1 figure déjà dans le modèle. Pour obtenir une séquence de facteurs différente, répétez l'analyse et entrez les facteurs dans un autre ordre.
Les degrés de liberté pour chaque composant du modèle sont les suivants :
Sources de variation | DL |
---|---|
Régression | p |
Erreur | n – p – 1 |
Total | n – 1 |
Terme | Description |
---|---|
n | nombre d'observations |
p | nombre de coefficients du modèle, indépendamment de la constante |
La formule du carré moyen (CM) de la régression est la suivante :
Terme | Description |
---|---|
réponse moyenne | |
ie réponse ajustée | |
p | nombre de termes dans le modèle |
Le carré moyen de l'erreur (également abrégé en CM Erreur ou CME et noté s2) est la variance autour de la droite de régression. La formule est la suivante :
Terme | Description |
---|---|
yi | ie valeur de réponse observée |
ième réponse ajustée | |
n | nombre d'observations |
p | nombre de coefficients dans le modèle, constante non incluse |
La formule pour le carré moyen (CM) total est la suivante :
Terme | Description |
---|---|
réponse moyenne | |
yi | ie valeur de réponse observée |
n | nombre d'observations |
Les formules pour les statistiques F sont les suivantes :
Terme | Description |
---|---|
CM Régression | Mesure de la variation de la réponse expliquée par le modèle actuel. |
CM Erreur | Mesure de la variation que le modèle n'explique pas. |
CM Terme | Mesure de l'ampleur de la variation expliquée par un terme après la prise en compte des autres termes du modèle. |
CM Inadéquation de l'ajustement | Mesure de la variation de la réponse qui peut être modélisée en ajoutant d'autres termes au modèle. |
CM Erreur pure | Mesure de la variation dans les données de réponse répétées. |
La valeur de p est une probabilité calculée à partir d'une loi F avec les degrés de liberté (DL) suivants :
1 − P(F ≤ fj)
Terme | Description |
---|---|
P(F ≤ f) | fonction de répartition de la loi F |
f | statistique f pour le test |
où n est le nombre d'observations et m le nombre de combinaisons de niveaux x distinctes
Des valeurs de F élevées et de faibles valeurs de p suggèrent que le modèle est inadapté.
1 − P(F ≤ fj)
Terme | Description |
---|---|
P(F ≤ fj) | fonction de répartition de la loi F |
fj | statistique f pour le test |