Tableau d'analyse de la variance pour la fonction ANOVA équilibrée

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique du tableau d'analyse de la variance.

DL

Le nombre total de degrés de liberté (DL) représente la quantité d'informations dans vos données. L'analyse utilise ces informations pour estimer les valeurs des paramètres de population inconnus. Le nombre total de DL est déterminé par le nombre d'observations dans votre échantillon. Les DL d'un terme affichent la quantité d'informations utilisée par ce terme. Le fait d'accroître l'effectif de l'échantillon permet d'obtenir davantage d'informations sur la population, ce qui augmente le nombre total de degrés de liberté. Le fait d'augmenter le nombre de termes dans votre modèle utilise plus d'informations, ce qui réduit le nombre de DL disponibles pour évaluer la variabilité des paramètres estimés.

Somme des carrés

Les sommes des carrés ajustées sont des mesures de la variation des différentes composantes du modèle. L'ordre des prédicteurs dans le modèle n'a aucun effet sur le calcul des sommes des carrés ajustées. Dans le tableau d'analyse de la variance, Minitab divise les sommes des carrés en différentes composantes qui décrivent la variation due à différentes sources.

Terme SomCar ajust
La somme des carrés ajustée pour un terme représente l'augmentation de la somme des carrés de la régression obtenue par rapport à un modèle qui comporte uniquement les autres termes. Elle permet ainsi de quantifier la variation des données de réponse expliquée par chaque terme du modèle.
SomCar ajust de l'erreur
La somme des carrés de l'erreur correspond à la somme des carrés des valeurs résiduelles. Elle quantifie la variation des données non expliquée par les prédicteurs.
SomCar ajust totale
La somme totale des carrés est obtenue en additionnant la somme des carrés du terme et la somme des carrés de l'erreur. Elle quantifie la variation totale dans les données.

Interprétation

Minitab utilise la somme des carrés ajustée pour calculer la valeur de p pour un terme. Minitab utilise aussi les sommes des carrés pour calculer la statistique R2. En général, vous interprétez les valeurs de p et la statistique R2 plutôt que les sommes des carrés.

CM

Les carrés moyens (CM) ajustés mesurent la proportion de variation expliquée par un terme ou un modèle, en supposant que tous les autres termes sont dans le modèle, quel que soit l'ordre dans lequel ils ont été saisis. Contrairement aux sommes des carrés ajustées, les carrés moyens ajustés tiennent compte des degrés de liberté.

Le carré moyen ajusté de l'erreur (également noté CME ou s2) est la variance autour des valeurs ajustées.

Interprétation

Minitab utilise les carrés moyens ajustés pour calculer la valeur de p pour un terme. Minitab les utilise également pour calculer la statistique R2 ajusté. En général, vous interprétez les valeurs de p et la statistique R2 ajusté plutôt que les carrés moyens ajustés.

Valeur F

Une valeur F apparaît pour chaque terme dans le tableau d'analyse de la variance. La valeur F est une statistique de test utilisée pour déterminer si le terme est associé à la réponse.

Interprétation

Minitab utilise la valeur F pour calculer la valeur de p, qui vous permet de déterminer si des termes sont significatifs et de choisir le modèle approprié. La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.

Une valeur F suffisamment élevée indique que le terme ou le modèle est significatif.

Si vous souhaitez utiliser la valeur F pour savoir si l'hypothèse nulle doit être rejetée, comparez-la à votre valeur critique. Vous pouvez calculer la valeur critique dans Minitab ou rechercher la valeur critique dans un tableau de loi F, disponible dans la plupart des livres de statistiques. Pour plus d'informations sur la façon d'utiliser Minitab pour calculer la valeur critique, accédez à la rubrique Utilisation de la fonction de répartition (CDF) inverse et cliquez sur "Utiliser la CDF inverse pour calculer des valeurs critiques".

Valeur de p - Terme

La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.

Interprétation

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.
Pour cette analyse dans Minitab, le modèle doit être hiérarchique. Dans un modèle hiérarchique, tous les termes d'ordre inférieur qui sont inclus dans les termes d'ordre supérieur apparaissent aussi dans le modèle. Par exemple, un modèle qui comprend le terme d'interaction A*B*C est hiérarchique s'il comprend les termes suivants : A, B, C, A*B, A*C et B*C.
Si un terme d'un modèle est statistiquement significatif, l'interprétation dépend du type de terme concerné. Les interprétations sont les suivantes :
  • Si un facteur fixe est significatif, vous pouvez en conclure que les moyennes des niveaux ne sont pas toutes égales.
  • Si un facteur aléatoire est significatif, vous pouvez en conclure qu'il contribue à la variation dans la réponse.
  • Si un terme d'interaction est significatif, la relation entre l'un des facteurs et la réponse dépend des autres facteurs du terme. Dans ce cas, vous ne devez pas interpréter les effets principaux sans prendre en compte l'effet d'interaction.

Utilisez le tableau des moyennes pour voir les différences qui sont statistiquement significatives entre les niveaux de facteurs dans vos données. La moyenne de chaque groupe fournit une estimation de la moyenne de chaque population. Recherchez les différences entre les moyennes des groupes pour les termes qui sont statistiquement significatifs.