Beispiel für Regressionsmodell anpassen

Ein Chemiker in der Forschung möchte herausfinden, wie verschiedene Prädiktoren mit der Knitterfestigkeit von Baumwollstoff zusammenhängen. Der Chemiker untersucht 32 Stücke Baumwollzellulose, die bei unterschiedlichen Einstellungen von Vernetzungszeit, Vernetzungstemperatur, Formaldehydkonzentration und Katalysatorverhältnis hergestellt wurden. Für jedes Stück Stoff wird die sogenannte Durable-Press-Einstufung aufgezeichnet, die ein Maß für die Knitterfestigkeit darstellt.

Der Chemiker führt eine multiple Regression durch, um ein Modell mit den Prädiktoren anzupassen und die Prädiktoren zu entfernen, die keine statistisch signifikante Beziehung mit der Antwortvariablen aufweisen.

  1. Öffnen Sie die Beispieldaten Knitterfestigkeit.MTW.
  2. Wählen Sie Statistik > Regression > Regression > Regressionsmodell anpassen aus.
  3. Geben Sie im Feld Antworten die Spalte Bewertung ein.
  4. Geben Sie im Feld Stetige Prädiktoren die Spalten Konz Verhältnis Temp Zeit ein.
  5. Klicken Sie auf Grafiken.
  6. Wählen Sie unter Effecktediagramme die Option Pareto aus.
  7. Wählen Sie unter Residuendiagramme die Option Vier-in-eins aus.
  8. Geben Sie im Feld Residuen vs. Variablen die Spalten Konz Verhältnis Temp Zeit ein.
  9. Klicken Sie in den einzelnen Dialogfeldern auf OK.

Interpretieren der Ergebnisse

Die Prädiktoren Temperatur, Katalysatorverhältnis und Formaldehydkonzentration weisen p-Werte auf, die kleiner als das Signifikanzniveau 0,05 sind. Diese Ergebnisse weisen darauf hin, dass diese Prädiktoren einen statistisch signifikanten Effekt auf die Knitterfestigkeit haben. Der p-Wert für die Zeit ist größer als 0,05, was darauf hindeutet, dass es nicht genügend Anzeichen für die Schlussfolgerung gibt, dass die Zeit in einer Beziehung mit der Antwortvariablen steht. Der Chemiker sollte das Modell möglicherweise ohne diesen Prädiktor erneut anpassen.

Das Pareto-Diagramm zeigt, dass die Effekte von Temperatur, Katalysatorverhältnis und Formaldehydkonzentration auf einem Signifikanzniveau von 0,05 statistisch signifikant sind. Der größte Effekt ist das Katalysatorverhältnis, da der entsprechende Balken am längsten ist. Der Effekt der Zeit ist am kleinsten, da der entsprechende Balken am kürzesten ist.

Die Residuendiagramme weisen darauf hin, dass möglicherweise Probleme mit dem Modell vorliegen.
  • Die Punkte im Diagramm der Residuen im Vergleich zu den Anpassungen scheinen nicht zufällig um null verteilt zu sein. Offenbar gibt es Häufungen von Punkten, die verschiedene Gruppen in den Daten darstellen könnten. Der Chemiker sollte die Gruppen untersuchen, um deren Ursache zu ermitteln.
  • Das Diagramm der Residuen im Vergleich zum Verhältnis zeigt eine Krümmung; dies deutet auf eine gekrümmte Beziehung zwischen Katalysatorverhältnis und Knittern hin. Der Chemiker sollte in Betracht ziehen, dem Modell einen quadratischen Term des Verhältnisses hinzuzufügen.

Regressionsgleichung

Bewertung=-0,756 + 0,1545 Konz + 0,2171 Verhältnis + 0,01081 Temp + 0,0946 Zeit

Koeffizienten

TermKoefSE Koeft-Wertp-WertVIF
Konstante-0,7560,736-1,030,314 
Konz0,15450,06332,440,0221,03
Verhältnis0,21710,03166,860,0001,02
Temp0,010810,004622,340,0271,04
Zeit0,09460,05461,730,0941,00

Zusammenfassung des Modells

SR-QdR-Qd(kor)R-Qd(prog)
0,81184072,92%68,90%62,81%

Varianzanalyse

QuelleDFKor SSKor MSF-Wertp-Wert
Regression447,909611,977418,170,000
  Konz13,92323,92325,950,022
  Verhältnis131,021631,021647,070,000
  Temp13,60313,60315,470,027
  Zeit11,98391,98393,010,094
Fehler2717,79530,6591   
  Fehlende Anpassung2517,78360,7113121,940,008
  Reiner Fehler20,01170,0058   
Gesamt3165,7049     

Anpassungen und Bewertung für ungewöhnliche Beobachtungen

BeobBewertungAnpassungResidStd. Resid
94,8003,1781,6222,06R
R  Großes Residuum