Interprétation des résultats principaux pour la fonction Analyser un plan factoriel

Suivez la procédure ci-dessous pour analyser un plan factoriel. Les résultats principaux incluent le diagramme de Pareto, les valeurs de p, les coefficients, les statistiques récapitulatives du modèle et les graphiques des valeurs résiduelles.

Etape 1 : Déterminer les termes qui contribuent le plus à la variabilité de la réponse

Utilisez un diagramme de Pareto des effets pour comparer la valeur relative et la signification statistique des effets principaux et des effets des interactions. Le diagramme présente le type d'effet comme suit :
  • Si le modèle n'inclut aucun terme d'erreur, le diagramme affiche la valeur absolue des effets non normalisés.
  • Si le modèle inclut un terme d'erreur, le diagramme affiche la valeur absolue des effets normalisés.

Minitab représente les effets par ordre décroissant de leurs valeurs absolues. La ligne de référence du diagramme indique les effets significatifs. Par défaut, Minitab utilise un seuil de signification de 0,05 pour tracer la ligne de référence. Sinon, Minitab utilise la méthode de Lenth pour tracer la ligne de référence.

Résultats principaux : diagramme de Pareto

Dans ces résultats, les quatre effets principaux sont statistiquement significatifs (α = 0,05). Ces effets significatifs sont le type de matériau (A), la pression d'injection (B), la température d'injection (C) et la température de rafraîchissement (D).

De plus, vous pouvez voir que l'effet maximal est la pression d'injection (B), car c'est celui qui a la barre la plus grande. L'interaction entre la pression d'injection et la température de rafraîchissement (BD) est l'effet minimal : c'est celui qui a la barre la plus petite.

Etape 2 : Déterminer les termes qui ont des effets statistiquement significatifs sur la réponse

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est que le coefficient du terme est égal à zéro, ce qui implique qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.
Si un terme d'un modèle est statistiquement significatif, l'interprétation dépend du type de terme concerné. Les interprétations sont les suivantes :
  • Si le coefficient d'un facteur est significatif, vous pouvez en conclure que les moyennes des niveaux ne sont pas toutes égales.
  • Si un coefficient d'une covariable est significatif, une variation de la valeur de la variable entraîne une variation de la valeur de réponse moyenne.
  • Si un coefficient d'un terme d'interaction est significatif, la relation entre l'un des facteurs et la réponse dépend des autres facteurs du terme. Dans ce cas, vous ne devez pas interpréter les effets principaux sans prendre en compte l'effet d'interaction.
Coefficients codés Valeur Valeur Terme Effet Coeff Coef ErT de T de p FIV Constante 56,0 21,0 2,66 0,056 MesTemp -1,229 0,979 -1,25 0,278 5,87 Matériau 5,316 2,658 0,678 3,92 0,017 3,23 PressInj 5,645 2,822 0,401 7,04 0,002 1,13 TempInj 4,355 2,177 0,378 5,76 0,005 1,00 TempRafr -3,457 -1,729 0,420 -4,12 0,015 1,24 Matériau*PressInj -0,723 -0,361 0,415 -0,87 0,433 1,21 Matériau*TempInj -1,025 -0,512 0,443 -1,16 0,312 1,38 Matériau*TempRafr -0,208 -0,104 0,510 -0,20 0,848 1,82 PressInj*TempInj -0,837 -0,419 0,510 -0,82 0,458 1,82 PressInj*TempRafr -0,055 -0,027 0,382 -0,07 0,947 1,03 TempInj*TempRafr 1,933 0,966 0,381 2,54 0,064 1,02
Résultats principaux : valeur de p, coefficients

Dans ces résultats, les effets principaux pour Matériau, PressInj, TempInj et TempRafr sont statistiquement significatifs au seuil de signification de 0,05. Vous pouvez en conclure que la variation de ces variables entraîne une variation de la variable de réponse.

MesTemp est une covariable dans ce modèle. Le coefficient de l'effet principal représente la variation de la réponse moyenne lorsque la covariable augmente d'une unité et que tous les autres termes du modèle sont maintenus constants. Pour chaque augmentation de la température d'un degré, la résistance moyenne estimée diminue de 1,229.

Les termes d'interaction à 2 facteurs ne sont pas statistiquement significatifs. La relation entre chaque variable et la réponse peut ne pas dépendre de la valeur de l'autre variable.

Etape 3 : Déterminer l'ajustement du modèle à vos données

Pour déterminer l'ajustement du modèle aux données, étudiez les statistiques d'adéquation de l'ajustement dans le tableau Récapitulatif du modèle.

S

Utilisez S pour évaluer la capacité du modèle à décrire la réponse. Utilisez S plutôt que les statistiques R2 pour comparer l'ajustement des modèles qui n'ont pas de constante.

S est mesuré en unités de la variable de réponse et représente la distance entre les valeurs de données et les valeurs ajustées. Plus S est petit, mieux le modèle décrit la réponse. Cependant, une faible valeur de S n'indique pas en soi que le modèle respecte les hypothèses du modèle. Vous devez examiner les graphiques des valeurs résiduelles pour vérifier les hypothèses.

R carré

Plus la valeur R2 est élevée, plus le modèle est ajusté à vos données. R2 est toujours compris entre 0 et 100 %.

La valeur R2 augmente toujours lorsque vous ajoutez des prédicteurs à un modèle. Par exemple, le meilleur modèle à 5 prédicteurs aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 prédicteurs. Par conséquent, R2 est surtout utile pour comparer des modèles de même taille.

R carré (ajust)

Utilisez la valeur R2 ajusté pour comparer des modèles n'ayant pas le même nombre de prédicteurs. R2 augmente toujours lorsque vous ajoutez un prédicteur au modèle, même lorsque ce prédicteur n'apporte aucune amélioration réelle au modèle. La valeur de R2 ajusté intègre le nombre de prédicteurs dans le modèle pour vous aider à choisir le modèle correct.

R carré (prév)

La valeur R2 prévu permet de déterminer la capacité de votre modèle à prévoir la réponse pour de nouvelles observations. Les modèles ayant des valeurs de R2 prévu élevées ont une meilleure capacité de prévision.

Une valeur de R2 prévu considérablement inférieure à R2 peut être un signe de surajustement du modèle. Un modèle est dit surajusté lorsqu'il inclut des termes pour des effets qui ne sont pas importants dans la population. Le modèle est alors spécialement ajusté aux données des échantillons, mais risque ne pas être utile pour effectuer des prévisions concernant la population entière.

La valeur R2 prévu peut également être plus utile que R2 ajusté pour comparer des modèles, car elle est calculée avec des observations qui ne sont pas incluses dans le calcul du modèle.

Prenez en compte les points suivants lors de l'interprétation des valeurs de R2 :
  • Les petits échantillons ne fournissent pas d'estimation précise de la force de la relation entre la réponse et les prédicteurs. Pour obtenir une valeur R2 plus précise, vous devez utiliser un échantillon plus grand (en général, 40 ou plus).
  • R2 n'est qu'une des mesures de l'ajustement du modèle aux données. Même si un modèle a une valeur R2 élevée, vous devez consulter les graphiques des valeurs résiduelles pour vérifier que le modèle respecte les hypothèses.
Résultats principaux : S, R carré, R carré (ajust), R carré (prév)

Dans ces résultats, le modèle explique 98,02 % de la variation de la luminosité. Pour ces données, la valeur de R2 indique que le modèle fournit un ajustement aux données correct. Si des modèles supplémentaires sont ajustés avec d'autres prédicteurs, utilisez les valeurs de R2 ajusté et les valeurs de R2 prévu pour comparer l'ajustement des modèles aux données.

Récapitulatif du modèle R carré R carré S R carré (ajust) (prév) 1,51005 98,02% 92,57% 70,86%

Etape 4 : Déterminer si votre modèle vérifie les hypothèses de l'analyse

Les graphiques des valeurs résiduelles permettent de déterminer si le modèle est adapté et si les hypothèses de l'analyse sont vérifiées. Si elles ne le sont pas, il se peut que le modèle ne soit pas ajusté aux données et vous devez être prudent lors de l'interprétation des résultats.

Pour plus d'informations sur la manière de traiter les schémas dans les graphiques des valeurs résiduelles, reportez-vous à la rubrique Graphiques des valeurs résiduelles pour la fonction Analyser un plan factoriel et cliquez sur le nom du graphique des valeurs résiduelles dans la liste située en haut de la page.

Graphique des valeurs résiduelles en fonction des valeurs ajustées

Les schémas du tableau suivant peuvent indiquer que le modèle n'est pas adapté.
Schéma Ce que le schéma indique
Eparpillement ou répartition déséquilibrée des valeurs résiduelles en fonction des valeurs ajustées Variance non constante
Curviligne Un terme d'ordre supérieur manquant
Un point très éloigné de zéro Une valeur aberrante
Un point éloigné des autres points dans le sens des x Un point influent

Utilisez le diagramme des valeurs résiduelles en fonction des valeurs ajustées pour vérifier l'hypothèse selon laquelle les valeurs résiduelles suivent une loi normale et ont une variance constante. Dans l'idéal, les points doivent être répartis aléatoirement des deux côtés de 0, sans schéma reconnaissable.

Graphique des valeurs résiduelles en fonction de l'ordre

Utilisez le diagramme des valeurs résiduelles en fonction de l'ordre pour vérifier l'hypothèse selon laquelle les valeurs résiduelles sont indépendantes les unes par rapport aux autres. Les valeurs résiduelles indépendantes ne présentent aucune tendance ou schéma lorsqu'elles sont affichées dans un ordre chronologique. La présence de schémas dans les points peut indiquer que les valeurs résiduelles qui sont proches les unes des autres peuvent être corrélées, et ne sont donc pas indépendantes. Idéalement, les valeurs résiduelles du graphique doivent être réparties de façon aléatoire autour de la ligne centrale.
Si vous observez un schéma, étudiez-en la cause. Les types de schémas suivants peuvent indiquer que les valeurs résiduelles sont corrélées.
Tendance
Equipe
Cycle

Droite de Henry des valeurs résiduelles

Utilisez la droite de Henry des valeurs résiduelles afin de vérifier l'hypothèse selon laquelle les valeurs résiduelles sont normalement distribuées. La droite de Henry des valeurs résiduelles doit suivre approximativement une ligne droite.

Les schémas du tableau suivant peuvent indiquer que le modèle n'est pas adapté.

Schéma Ce que le schéma indique
Une ligne pas droite Non-normalité
Un point éloigné de la ligne Une valeur aberrante
Modification de la pente Une variable non identifiée
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique