Utilisez un diagramme de Pareto des effets pour comparer la valeur relative et la signification statistique des termes. Le diagramme apparaît lorsque le modèle laisse des degrés de liberté pour l'erreur.
Minitab représente les termes en fonction de leurs valeurs absolues par ordre décroissant. La ligne de référence du diagramme indique les termes significatifs. Par défaut, Minitab utilise un seuil de signification de 0,05 pour tracer la ligne de référence.
Terme | Coeff | Coef ErT | Valeur de T | Valeur de p | FIV |
---|---|---|---|---|---|
Constante | -0,756 | 0,736 | -1,03 | 0,314 | |
Conc | 0,1545 | 0,0633 | 2,44 | 0,022 | 1,03 |
Rapport | 0,2171 | 0,0316 | 6,86 | 0,000 | 1,02 |
Tempé | 0,01081 | 0,00462 | 2,34 | 0,027 | 1,04 |
Temps | 0,0946 | 0,0546 | 1,73 | 0,094 | 1,00 |
La concentration en formaldéhyde, le rapport du catalyseur et la température des prédicteurs ont des valeurs de p inférieures au seuil de signification de 0,05. Ces résultats indiquent que les prédicteurs ont une relation significative avec la résistance au froissement d'un point de vue statistique. Par exemple, le coefficient pour la concentration en formaldéhyde estime que la résistance moyenne au froissement augmente de 0,1545 unité pour chaque incrément d'une unité de la concentration, alors que les autres termes du modèle sont constants.
La valeur de p pour la durée est supérieure à 0,05 ; les preuves ne suffisent donc pas à conclure que la durée est liée à la réponse. Le chimiste peut réajuster le modèle sans le prédicteur.
Pour déterminer l'ajustement du modèle aux données, étudiez les statistiques d'adéquation de l'ajustement dans le tableau Récapitulatif du modèle.
Utilisez S pour évaluer la capacité du modèle à décrire la réponse. Utilisez S plutôt que les statistiques R2 pour comparer l'ajustement des modèles qui n'ont pas de constante.
S est mesuré en unités de la variable de réponse et représente la distance entre les valeurs de données et les valeurs ajustées. Plus S est petit, mieux le modèle décrit la réponse. Cependant, une faible valeur de S n'indique pas en soi que le modèle respecte les hypothèses du modèle. Vous devez examiner les graphiques des valeurs résiduelles pour vérifier les hypothèses.
Plus la valeur R2 est élevée, plus le modèle est ajusté à vos données. R2 est toujours compris entre 0 et 100 %.
La valeur R2 augmente toujours lorsque vous ajoutez des prédicteurs à un modèle. Par exemple, le meilleur modèle à 5 prédicteurs aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 prédicteurs. Par conséquent, R2 est surtout utile pour comparer des modèles de même taille.
Utilisez la valeur R2 ajusté pour comparer des modèles n'ayant pas le même nombre de prédicteurs. R2 augmente toujours lorsque vous ajoutez un prédicteur au modèle, même lorsque ce prédicteur n'apporte aucune amélioration réelle au modèle. La valeur de R2 ajusté intègre le nombre de prédicteurs dans le modèle pour vous aider à choisir le modèle correct.
La valeur R2 prévu permet de déterminer la capacité de votre modèle à prévoir la réponse pour de nouvelles observations.Les modèles ayant des valeurs de R2 prévu élevées ont une meilleure capacité de prévision.
Une valeur de R2 prévu considérablement inférieure à R2 peut être un signe de surajustement du modèle. Un modèle est dit surajusté lorsqu'il inclut des termes pour des effets qui ne sont pas importants dans la population. Le modèle est alors spécialement ajusté aux données des échantillons, mais risque ne pas être utile pour effectuer des prévisions concernant la population entière.
La valeur R2 prévu peut également être plus utile que R2 ajusté pour comparer des modèles, car elle est calculée avec des observations qui ne sont pas incluses dans le calcul du modèle.
Les petits échantillons ne fournissent pas d'estimation précise de la force de la relation entre la réponse et les prédicteurs. Par exemple, pour obtenir une valeur R2 plus précise, vous devez utiliser un échantillon plus grand (en général, 40 ou plus).
Les statistiques d'adéquation de l'ajustement ne sont qu'un des types de mesures permettant d'évaluer l'ajustement du modèle. Même si un modèle a une valeur souhaitable, vous devez consulter les graphiques des valeurs résiduelles pour vérifier que le modèle respecte les hypothèses.
S | R carré | R carré (ajust) | R carré (prév) |
---|---|---|---|
0,811840 | 72,92% | 68,90% | 62,81% |
Dans ces résultats, le modèle explique environ 73 % de la variation de la réponse. Pour ces données, la valeur R2 indique que le modèle est bien ajusté aux données. Si vous ajustez d'autres modèles avec des prédicteurs différents, utilisez les valeurs R2 ajustées et les valeurs R2 prévues pour comparer le degré d'ajustement du modèle aux données.
Les graphiques des valeurs résiduelles permettent de déterminer si le modèle est adapté et si les hypothèses de l'analyse sont vérifiées. Si elles ne le sont pas, il se peut que le modèle ne soit pas ajusté aux données et vous devez être prudent lors de l'interprétation des résultats.
Pour plus d'informations sur la manière de traiter les schémas dans les graphiques des valeurs résiduelles, reportez-vous à la rubrique Parcelles résiduelles pour Ajuster le modèle de régression et Regressão Linear et cliquez sur le nom du graphique des valeurs résiduelles dans la liste située en haut de la page.
Utilisez le diagramme des valeurs résiduelles en fonction des valeurs ajustées pour vérifier l'hypothèse selon laquelle les valeurs résiduelles suivent une loi normale et ont une variance constante. Dans l'idéal, les points doivent être répartis aléatoirement des deux côtés de 0, sans schéma reconnaissable.
Schéma | Ce que le schéma indique |
---|---|
Eparpillement ou répartition déséquilibrée des valeurs résiduelles en fonction des valeurs ajustées | Variance non constante |
Curviligne | Un terme d'ordre supérieur manquant |
Un point très éloigné de zéro | Une valeur aberrante |
Un point éloigné des autres points dans le sens des x | Un point influent |
Utilisez la droite de Henry des valeurs résiduelles afin de vérifier l'hypothèse selon laquelle les valeurs résiduelles sont normalement distribuées. La droite de Henry des valeurs résiduelles doit suivre approximativement une ligne droite.
Schéma | Ce que le schéma indique |
---|---|
Une ligne qui n'est pas droite | Non-normalité |
Un point éloigné de la ligne | Une valeur aberrante |
Une modification de la pente | Une variable non identifiée |
Les tracés de contours superposés sont disponibles lorsque vous ajustez un modèle dans le Stat menu.