Utilisez un diagramme de Pareto des effets normalisés pour comparer l'importance relative et la signification statistique des effets principaux, des effets quadratiques et des effets d'interaction. Si le modèle inclut un terme d'erreur, le diagramme affiche la valeur absolue des effets normalisés. Si le modèle n'inclut pas de terme d'erreur, Minitab ne crée pas de diagramme de Pareto.
Minitab présente les effets normalisés par ordre décroissant de leurs valeurs absolues. La ligne de référence du diagramme indique les effets significatifs. Par défaut, Minitab utilise un seuil de signification de 0,05 pour tracer la ligne de référence.
Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est que le coefficient du terme est égal à zéro, ce qui implique qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Si un terme d'un modèle est statistiquement significatif, l'interprétation dépend du type de terme concerné. Les interprétations sont les suivantes :
Source | DL | SomCar ajust | CM ajust | Valeur F | Valeur de p |
---|---|---|---|---|---|
Modèle | 14 | 1137,51 | 81,251 | 4,19 | 0,004 |
Linéaires | 4 | 218,65 | 54,662 | 2,82 | 0,060 |
TempéBar | 1 | 68,13 | 68,129 | 3,52 | 0,079 |
TpsArrêt | 1 | 70,94 | 70,939 | 3,66 | 0,074 |
PressBar | 1 | 52,62 | 52,616 | 2,71 | 0,119 |
TempéMat | 1 | 26,96 | 26,963 | 1,39 | 0,255 |
Carré | 4 | 372,07 | 93,018 | 4,80 | 0,010 |
TempéBar*TempéBar | 1 | 202,61 | 202,611 | 10,45 | 0,005 |
TpsArrêt*TpsArrêt | 1 | 175,32 | 175,318 | 9,05 | 0,008 |
PressBar*PressBar | 1 | 50,52 | 50,522 | 2,61 | 0,126 |
TempéMat*TempéMat | 1 | 37,87 | 37,866 | 1,95 | 0,181 |
Interaction à 2 facteurs | 6 | 546,79 | 91,132 | 4,70 | 0,006 |
TempéBar*TpsArrêt | 1 | 540,47 | 540,470 | 27,89 | 0,000 |
TempéBar*PressBar | 1 | 0,12 | 0,121 | 0,01 | 0,938 |
TempéBar*TempéMat | 1 | 0,30 | 0,305 | 0,02 | 0,902 |
TpsArrêt*PressBar | 1 | 4,84 | 4,840 | 0,25 | 0,624 |
TpsArrêt*TempéMat | 1 | 0,90 | 0,899 | 0,05 | 0,832 |
PressBar*TempéMat | 1 | 0,16 | 0,160 | 0,01 | 0,929 |
Erreur | 16 | 310,08 | 19,380 | ||
Inadéquation de l'ajustement | 10 | 308,20 | 30,820 | 98,51 | 0,000 |
Erreur pure | 6 | 1,88 | 0,313 | ||
Total | 30 | 1447,60 |
Pour déterminer l'ajustement du modèle aux données, étudiez les statistiques d'adéquation de l'ajustement dans le tableau Récapitulatif du modèle.
Utilisez S pour évaluer la capacité du modèle à décrire la réponse. Utilisez S plutôt que les statistiques R2 pour comparer l'ajustement des modèles.
S est mesuré dans les unités de la variable de réponse et représente la variation de la distance entre les valeurs de données et la réponse de surface réelle. Plus S est petit, mieux le modèle décrit la réponse. Cependant, une faible valeur de S n'indique pas en soi que le modèle respecte les hypothèses du modèle. Vous devez examiner les graphiques des valeurs résiduelles pour vérifier les hypothèses.
Plus la valeur R2 est élevée, plus le modèle est ajusté à vos données. R2 est toujours compris entre 0 et 100 %.
La valeur R2 augmente toujours lorsque vous ajoutez des prédicteurs à un modèle. Par exemple, le meilleur modèle à 5 prédicteurs aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 prédicteurs. Par conséquent, R2 est surtout utile pour comparer des modèles de même taille.
Utilisez la valeur R2 ajusté pour comparer des modèles n'ayant pas le même nombre de prédicteurs. R2 augmente toujours lorsque vous ajoutez un prédicteur au modèle, même lorsque ce prédicteur n'apporte aucune amélioration réelle au modèle. La valeur de R2 ajusté intègre le nombre de prédicteurs dans le modèle pour vous aider à choisir le modèle correct.
La valeur R2 prévu permet de déterminer la capacité de votre modèle à prévoir la réponse pour de nouvelles observations. Les modèles ayant des valeurs de R2 prévu élevées ont une meilleure capacité de prévision.
Une valeur de R2 prévu considérablement inférieure à R2 peut être un signe de surajustement du modèle. Un modèle est dit surajusté lorsqu'il inclut des termes pour des effets qui ne sont pas importants dans la population. Le modèle est alors spécialement ajusté aux données des échantillons, mais risque ne pas être utile pour effectuer des prévisions concernant la population entière.
La valeur R2 prévu peut également être plus utile que R2 ajusté pour comparer des modèles, car elle est calculée avec des observations qui ne sont pas incluses dans le calcul du modèle.
S | R carré | R carré (ajust) | R carré (prév) |
---|---|---|---|
4,40228 | 78,58% | 59,84% | 0,00% |
Dans ces résultats, le modèle explique 78,58 % de la variation de la luminosité. Cependant, le R2(prév) de 0 % laisse penser que le modèle est surajusté. Si d'autres modèles sont ajustés avec des prédicteurs différents, utilisez les valeurs de R2 ajusté et les valeurs de R2 prévu pour comparer l'ajustement des modèles aux données.
Les graphiques des valeurs résiduelles permettent de déterminer si le modèle est adapté et si les hypothèses de l'analyse sont vérifiées. Si elles ne le sont pas, il se peut que le modèle ne soit pas ajusté aux données et vous devez être prudent lors de l'interprétation des résultats.
Pour plus d'informations sur la manière de traiter les schémas dans les graphiques des valeurs résiduelles, reportez-vous à la rubrique Graphiques des valeurs résiduelles pour la fonction Analyser un plan factoriel et cliquez sur le nom du graphique des valeurs résiduelles dans la liste située en haut de la page.
Schéma | Ce que le schéma indique |
---|---|
Eparpillement ou répartition déséquilibrée des valeurs résiduelles en fonction des valeurs ajustées | Variance non constante |
Curviligne | Un terme d'ordre supérieur manquant |
Un point très éloigné de zéro | Une valeur aberrante |
Un point éloigné des autres points dans le sens des x | Un point influent |
Utilisez le diagramme des valeurs résiduelles en fonction des valeurs ajustées pour vérifier l'hypothèse selon laquelle les valeurs résiduelles suivent une loi normale et ont une variance constante. Dans l'idéal, les points doivent être répartis aléatoirement des deux côtés de 0, sans schéma reconnaissable.
Utilisez la droite de Henry des valeurs résiduelles afin de vérifier l'hypothèse selon laquelle les valeurs résiduelles sont normalement distribuées. La droite de Henry des valeurs résiduelles doit suivre approximativement une ligne droite.
Les schémas du tableau suivant peuvent indiquer que le modèle n'est pas adapté.
Schéma | Ce que le schéma indique |
---|---|
Une ligne pas droite | Non-normalité |
Un point éloigné de la ligne | Une valeur aberrante |
Modification de la pente | Une variable non identifiée |