Exemple pour la fonction Ajuster le modèle de régression

Un chimiste cherche à comprendre la façon dont plusieurs prédicteurs sont associés à la résistance au froissement d'un tissu en coton. Il examine 32 pièces de cellulose de coton produites à différentes valeurs de durée de séchage, de température de séchage, de concentration en formaldéhyde et de proportions de catalyseur. La permanence des plis, qui mesure la résistance au froissement, a été enregistrée pour chaque pièce de coton.

Le chimiste effectue une analyse de régression multiple pour ajuster un modèle avec les prédicteurs et éliminer les prédicteurs n'ayant aucune relation statistiquement significative avec la réponse.

  1. Ouvrez le fichier de données échantillons, RésistanceFroissement.MTW.
  2. Sélectionnez Stat > Régression > Régression > Ajuster le modèle de régression.
  3. Dans la zone Réponses, saisissez Qualité.
  4. Dans la zone Prédicteurs continus, saisissez Conc Rapport Tempé Temps.
  5. Cliquez sur Graphiques.
  6. Sous Diagrammes des effets, sélectionnez Pareto.
  7. Sous Graphiques des valeurs résiduelles, sélectionnez Quatre en un.
  8. Dans la zone Valeurs résiduelles en fonction des variables, saisissez Conc Rapport Tempé Temps.
  9. Cliquez sur OK dans chaque boîte de dialogue.

Interprétation des résultats

La température, le rapport du catalyseur et la concentration en formaldéhyde des prédicteurs ont des valeurs de p inférieures au seuil de signification de 0,05. Ces résultats indiquent que les prédicteurs ont un impact statistiquement significatif sur la résistance au froissement. La valeur de p pour la durée est supérieure à 0,05 ; les preuves ne suffisent donc pas à conclure que la durée est liée à la réponse. Le chimiste peut réajuster le modèle sans le prédicteur.

Le diagramme de Pareto montre que les effets de la température, du rapport du catalyseur et de la concentration en formaldéhyde sont statistiquement significatifs au seuil de signification de 0,05. L'effet maximal est le rapport du catalyseur car c'est celui qui a la barre la plus grande. L'effet pour le temps est le plus petit, car c'est celui qui a la barre la plus courte.

Les graphiques des valeurs résiduelles indiquent qu'il peut y avoir des problèmes avec le modèle.
  • Les points sur le diagramme des valeurs résiduelles en fonction des valeurs ajustées ne semblent pas être dispersés de façon aléatoire autour de zéro. Ils ressemblent à des rassemblements de points pouvant représenter différents groupes dans les données. Le chimiste doit examiner les groupes pour en déterminer la cause.
  • Le diagramme des valeurs résiduelles en fonction du rapport montre une courbe, ce qui suggère une relation curviligne entre le rapport du catalyseur et le froissement. Le chimiste devrait ajouter un terme quadratique de rapport au modèle.

Equation de régression

Qualité=-0,756 + 0,1545 Conc + 0,2171 Rapport + 0,01081 Tempé + 0,0946 Temps

Coefficients

TermeCoeffCoef ErTValeur de TValeur de pFIV
Constante-0,7560,736-1,030,314 
Conc0,15450,06332,440,0221,03
Rapport0,21710,03166,860,0001,02
Tempé0,010810,004622,340,0271,04
Temps0,09460,05461,730,0941,00

Récapitulatif du modèle

SR carréR carré
(ajust)
R carré
(prév)
0,81184072,92%68,90%62,81%

Analyse de la variance

SourceDLSomCar ajustCM ajustValeur FValeur de p
Régression447,909611,977418,170,000
  Conc13,92323,92325,950,022
  Rapport131,021631,021647,070,000
  Tempé13,60313,60315,470,027
  Temps11,98391,98393,010,094
Erreur2717,79530,6591   
  Inadéquation de l'ajustement2517,78360,7113121,940,008
  Erreur pure20,01170,0058   
Total3165,7049     

Ajustements et diagnostics pour les observations aberrantes

ObservationQualitéValeur
ajustée
RésiduelleVal.
résid.
norm.
94,8003,1781,6222,06R
R : Valeur résiduelle élevée