Interprétation des résultats principaux pour la fonction ANOVA équilibrée

Suivez la procédure ci-dessous pour interpréter une ANOVA équilibrée. Les résultats principaux incluent la valeur de p, les moyennes de groupes, R2 et les graphiques des valeurs résiduelles.

Etape 1 : Déterminer si l'association entre la réponse et le terme est statistiquement significative

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.
Pour cette analyse dans Minitab, le modèle doit être hiérarchique. Dans un modèle hiérarchique, tous les termes d'ordre inférieur qui sont inclus dans les termes d'ordre supérieur apparaissent aussi dans le modèle. Par exemple, un modèle qui comprend le terme d'interaction A*B*C est hiérarchique s'il comprend les termes suivants : A, B, C, A*B, A*C et B*C.
Si un terme d'un modèle est statistiquement significatif, l'interprétation dépend du type de terme concerné. Les interprétations sont les suivantes :
  • Si un facteur fixe est significatif, vous pouvez en conclure que les moyennes des niveaux ne sont pas toutes égales.
  • Si un facteur aléatoire est significatif, vous pouvez en conclure qu'il contribue à la variation dans la réponse.
  • Si un terme d'interaction est significatif, la relation entre l'un des facteurs et la réponse dépend des autres facteurs du terme. Dans ce cas, vous ne devez pas interpréter les effets principaux sans prendre en compte l'effet d'interaction.

Utilisez le tableau des moyennes pour voir les différences qui sont statistiquement significatives entre les niveaux de facteurs dans vos données. La moyenne de chaque groupe fournit une estimation de la moyenne de chaque population. Recherchez les différences entre les moyennes des groupes pour les termes qui sont statistiquement significatifs.

Pour les effets principaux, le tableau affiche les groupes propres à chaque facteur, ainsi que leurs moyennes. Pour les effets d'interaction, le tableau affiche toutes les combinaisons de groupes possibles. Si un terme d'interaction est statistiquement significatif, vous ne pouvez pas interpréter les effets principaux sans tenir compte des effets d'interaction.

Informations sur les facteurs

FacteurTypeNiveauxValeurs
PériodeFixe21; 2
OpérateurAléatoire31; 2; 3
RéglageFixe335; 44; 52

Analyse de la variance pour Epaisseur

SourceDLSomme des
carrés
CMFP
  Période19,09,000,290,644 
  Opérateur21120,9560,444,280,081x
  Réglage215676,47838,1973,180,001 
  Période*Opérateur262,031,004,340,026 
  Période*Réglage2114,557,258,020,002 
  Opérateur*Réglage4428,4107,1115,010,000 
Erreur22157,07,14     
Total3517568,2       
x n'est pas un test F exact.

Récapitulatif du modèle

SR carréR carré
(ajust)
2,6714099,11%98,58%

Termes d'erreur pour les tests

SourceComposante
de variance
Terme
d'erreur
Espérance mathématique des
carrés moyens pour chaque terme
(avec modèle non restreint)
1Période  4(7) + 6 (4) + Q[1; 5]
2Opérateur35,789*(7) + 4 (6) + 6 (4) + 12 (2)
3Réglage  6(7) + 4 (6) + Q[3; 5]
4Période*Opérateur3,9777(7) + 6 (4)
5Période*Réglage  7(7) + Q[5]
6Opérateur*Réglage24,9947(7) + 4 (6)
7Erreur7,136  (7)
* Test synthétisé.

Termes d'erreur pour les tests synthétisés

SourceErreur - DLErreur - CMSynthèse du carré
moyen de l'erreur
2Opérateur5,12130,9747(4) + (6) - (7)

Moyennes

PériodeNEpaisseur
11867,7222
21868,7222
RéglageNEpaisseur
351240,5833
441273,0833
521291,0000
Période*RéglageNEpaisseur
1 35640,6667
1 44670,1667
1 52692,3333
2 35640,5000
2 44676,0000
2 52689,6667
Résultats principaux : valeur de p, tableau des moyennes

Réglage est un facteur fixe, et cet effet principal est significatif. Ce résultat indique que l'épaisseur moyenne du revêtement n'est pas la même pour tous les réglages de machine.

Période*Réglage est un effet d'interaction qui implique deux facteurs fixes. L'effet d'interaction est significatif, ce qui indique que la relation entre chaque facteur et la réponse dépend du niveau de l'autre facteur. Dans ce cas, vous ne devez pas interpréter les effets principaux sans prendre en compte l'effet d'interaction.

Dans ces résultats, le tableau des moyennes indique la variation de l'épaisseur moyenne en fonction de la période, du réglage de la machine et de chaque combinaison période/réglage de la machine. Le réglage est statistiquement significatif et les moyennes varient selon les différents réglages de la machine. Cependant, étant donné que le terme d'interaction Période*Réglage est lui aussi statistiquement significatif, vous ne pouvez pas interpréter les effets principaux sans tenir compte des effets d'interaction. Par exemple, le tableau du terme d'interaction indique qu'avec le réglage 44, la période 2 est associée à un revêtement plus épais. Par contre, avec le réglage 52, la période 1 est associée à un revêtement plus épais.

Opérateur est un facteur aléatoire et toutes les interactions qui incluent un facteur aléatoire sont considérées comme aléatoires. Si un facteur aléatoire est significatif, vous pouvez en conclure qu'il contribue à la variation dans la réponse. Le facteur Opérateur n'est pas significatif au seuil de signification de 0,05, mais les effets d'interaction qui incluent ce facteur sont eux significatifs. Ces effets d'interaction indiquent que la contribution de l'opérateur à la variation de la réponse dépend des valeurs de la période et du réglage de la machine.

Etape 2 : Déterminer l'ajustement du modèle à vos données

Pour déterminer l'ajustement du modèle aux données, étudiez les statistiques d'adéquation de l'ajustement dans le tableau Récapitulatif du modèle.

S

Utilisez S pour évaluer la capacité du modèle à décrire la réponse. Utilisez S plutôt que les statistiques R2 pour comparer l'ajustement des modèles qui n'ont pas de constante.

S est mesuré en unités de la variable de réponse et représente la distance entre les valeurs de données et les valeurs ajustées. Plus S est petit, mieux le modèle décrit la réponse. Cependant, une faible valeur de S n'indique pas en soi que le modèle respecte les hypothèses du modèle. Vous devez examiner les graphiques des valeurs résiduelles pour vérifier les hypothèses.

R carré

Plus la valeur R2 est élevée, plus le modèle est ajusté à vos données. R2 est toujours compris entre 0 et 100 %.

La valeur R2 augmente toujours lorsque vous ajoutez des prédicteurs à un modèle. Par exemple, le meilleur modèle à 5 prédicteurs aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 prédicteurs. Par conséquent, R2 est surtout utile pour comparer des modèles de même taille.

R carré (ajusté)

Utilisez la valeur R2 ajusté pour comparer des modèles n'ayant pas le même nombre de prédicteurs. R2 augmente toujours lorsque vous ajoutez un prédicteur au modèle, même lorsque ce prédicteur n'apporte aucune amélioration réelle au modèle. La valeur de R2 ajusté intègre le nombre de prédicteurs dans le modèle pour vous aider à choisir le modèle correct.

Prenez en compte les points suivants lors de l'interprétation des valeurs de R2 : 

  • Les petits échantillons ne fournissent pas d'estimation précise de la force de la relation entre la réponse et les prédicteurs. Par exemple, pour obtenir une valeur R2 plus précise, vous devez utiliser un échantillon plus grand (en général, 40 ou plus).

  • Les statistiques d'adéquation de l'ajustement ne sont qu'un des types de mesures permettant d'évaluer l'ajustement du modèle. Même si un modèle a une valeur souhaitable, vous devez consulter les graphiques des valeurs résiduelles pour vérifier que le modèle respecte les hypothèses.

Récapitulatif du modèle

SR carréR carré
(ajust)
2,6714099,11%98,58%
Résultats principaux : S, R carré, R carré (ajust)

Dans ces résultats, le modèle explique 99,11 % de la variation de l'épaisseur du revêtement. Pour ces données, la valeur de R2 indique que le modèle fournit un ajustement aux données correct. Si des modèles supplémentaires sont ajustés avec d'autres prédicteurs, utilisez les valeurs de R2 pour comparer l'ajustement des modèles aux données.

Etape 3 : Déterminer si votre modèle vérifie les hypothèses de l'analyse

Les graphiques des valeurs résiduelles permettent de déterminer si le modèle est adapté et si les hypothèses de l'analyse sont vérifiées. Si elles ne le sont pas, il se peut que le modèle ne soit pas ajusté aux données et vous devez être prudent lors de l'interprétation des résultats.

Pour plus d'informations sur la manière de traiter les schémas dans les graphiques des valeurs résiduelles, reportez-vous à la rubrique Diagrammes de valeurs résiduelles pour la fonction Ajuster le modèle linéaire général et cliquez sur le nom du graphique des valeurs résiduelles dans la liste située en haut de la page.

Graphique des valeurs résiduelles en fonction des valeurs ajustées

Utilisez le diagramme des valeurs résiduelles en fonction des valeurs ajustées pour vérifier l'hypothèse selon laquelle les valeurs résiduelles suivent une loi normale et ont une variance constante. Dans l'idéal, les points doivent être répartis aléatoirement des deux côtés de 0, sans schéma reconnaissable.

Les schémas du tableau suivant peuvent indiquer que le modèle n'est pas adapté.
Schéma Ce que le schéma indique
Eparpillement ou répartition déséquilibrée des valeurs résiduelles en fonction des valeurs ajustées Variance non constante
Curviligne Un terme d'ordre supérieur manquant
Un point très éloigné de zéro Une valeur aberrante
Un point éloigné des autres points dans le sens des x Un point influent
Dans ce graphique des valeurs résiduelles en fonction des valeurs ajustées, les données semblent être distribuées aléatoirement autour de zéro. Rien ne permet de penser que les valeurs résiduelles dépendent des valeurs ajustées.

Graphique des valeurs résiduelles en fonction de l'ordre

Utilisez le diagramme des valeurs résiduelles en fonction de l'ordre pour vérifier l'hypothèse selon laquelle les valeurs résiduelles sont indépendantes les unes par rapport aux autres. Les valeurs résiduelles indépendantes ne présentent aucune tendance ou schéma lorsqu'elles sont affichées dans un ordre chronologique. La présence de schémas dans les points peut indiquer que les valeurs résiduelles qui sont proches les unes des autres peuvent être corrélées, et ne sont donc pas indépendantes. Idéalement, les valeurs résiduelles du graphique doivent être réparties de façon aléatoire autour de la ligne centrale.
Si vous observez un schéma, étudiez-en la cause. Les types de schémas suivants peuvent indiquer que les valeurs résiduelles sont corrélées.
Tendance
Equipe
Cycle

Dans ce graphique des valeurs résiduelles en fonction de l'ordre, les valeurs résiduelles semblent être réparties de façon aléatoire autour de la ligne centrale. Rien ne permet de penser que les valeurs résiduelles ne sont pas indépendantes.

Droite de Henry

Utilisez la droite de Henry des valeurs résiduelles afin de vérifier l'hypothèse selon laquelle les valeurs résiduelles sont normalement distribuées. La droite de Henry des valeurs résiduelles doit suivre approximativement une ligne droite.

Les schémas du tableau suivant peuvent indiquer que le modèle n'est pas adapté.
Schéma Ce que le schéma indique
Une ligne qui n'est pas droite Non-normalité
Un point éloigné de la ligne Une valeur aberrante
Une modification de la pente Une variable non identifiée
Sur cette droite de Henry, les points suivent approximativement une ligne droite. Il n'existe aucun signe de non-normalité, de valeurs aberrantes ou de variables non identifiées.