Tabelle mit der Zusammenfassung des Modells für Darstellung der Anpassungslinie

Hier finden Sie Definitionen und Anleitungen zur Interpretation für jede Statistik in der Tabelle mit der Zusammenfassung des Modells.

S

S stellt die Standardabweichung der Distanz zwischen den Datenwerten und den angepassten Werten dar. S wird in der Maßeinheit der Antwortvariablen ausgedrückt.

Interpretation

Verwenden Sie S, um zu ermitteln, wie genau das Modell die Antwortvariable beschreibt. S wird in der Maßeinheit der Antwortvariablen ausgedrückt und stellt den Abstand der Datenwerte von den angepassten Werten dar. Je niedriger der Wert von S, desto genauer beschreibt das Modell die Antwortvariable. Ein niedriger Wert von S allein bedeutet jedoch nicht zwangsläufig, dass das Modell die Modellannahmen erfüllt. Prüfen Sie die Annahmen anhand der Residuendiagramme.

Angenommen, Sie sind für einen Hersteller von Kartoffelchips tätig, der die Faktoren untersucht, die den Prozentsatz der zerkrümelten Kartoffelchips in jeder Packung beeinflussen. Sie reduzieren das Modell auf die signifikanten Prädiktoren, und für S wird der Wert 1,79 berechnet. Dieses Ergebnis gibt an, dass die Standardabweichung der Datenpunkte um die angepassten Werte 1,79 beträgt. Beim Vergleichen von Modellen weisen Werte kleiner als 1,79 auf eine bessere und Werte größer als 1,79 auf eine schlechtere Anpassung hin.

R-Quadrat

R2 ist der Prozentsatz der Streuung in der Antwortvariablen, der durch das Modell erklärt wird. Sie wird berechnet als 1 minus das Verhältnis der Fehlersumme der Quadrate (was die Variation ist, die vom Modell nicht erklärt wird) zur Gesamtsumme der Quadrate (die die Gesamtvariation im Modell darstellt).

Interpretation

Verwenden Sie das R2, um zu bestimmen, wie gut das Modell für Ihre Daten passend ist. Je höher das R2, desto besser ist das Modell für Ihre Daten passend. R2 liegt immer zwischen 0 % und 100 %.

Du kannst ein angepasstes Liniendiagramm verwenden, um verschiedeneR2-Werte grafisch darzustellen. Das erste Diagramm zeigt ein einfaches Regressionsmodell, das 85,5 % der Variation der Antwortvariablen erklärt. Das zweite Diagramm zeigt ein Modell, das 22,6% der Variation in der Antwort erklärt. Je größer der vom Modell erklärte Anteil der Streuung, desto näher liegen die Datenpunkte an der angepassten Regressionslinie. Würde ein Modell theoretisch 100 % der Streuung erklären, wären die angepassten Werte immer gleich den beobachteten Werten, und sämtliche Datenpunkte würden auf der Anpassungslinie liegen. Selbst wenn R2 jedoch 100 % beträgt, sagt das Modell neue Beobachtungen nicht unbedingt gut voraus.
Berücksichtigen Sie bei der Interpretation des R2-Werts die folgenden Aspekte:
  • Der Wert von R2 nimmt beim Einbinden zusätzlicher Prädiktoren in das Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist R2 am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.
  • Kleine Stichproben ermöglichen keinen genauen Schätzwert für die Stärke der Beziehung zwischen der Antwortvariablen und den Prädiktoren. Wenn z. B. das R2 genauer sein muss, sollten Sie einen größeren Stichprobenumfang (im Allgemeinen 40 oder mehr) wählen.
  • Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme untersuchen, um sich zu vergewissern, dass das Modell die Modellannahmen erfüllt.

R-Qd(kor)

Das korrigierte R2 gibt den Prozentsatz der Streuung der Antwortvariablen an, der vom Modell erklärt wird, korrigiert nach der Anzahl der Prädiktoren im Modell in Bezug auf die Anzahl der Beobachtungen. Das korrigierte R2 wird als 1 minus dem Verhältnis zwischen dem mittleren quadrierten Fehler (MSE) und dem Gesamtmittel der Quadrate (MS Gesamt) berechnet.

Interpretation

Verwenden Sie das korrigierte R2, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. R2 nimmt stets zu, wenn Sie einen zusätzlichen Prädiktor in das Modell aufnehmen, selbst wenn damit keine tatsächliche Verbesserung des Modells verbunden ist. Der Wert des korrigierten R2 berücksichtigt die Anzahl der Prädiktoren im Modell, so dass Ihnen das Auswählen des richtigen Modells erleichtert wird.

Angenommen, Sie sind für einen Hersteller von Kartoffelchips tätig, der die Faktoren untersucht, die den Prozentsatz der zerkrümelten Kartoffelchips in jeder Packung beeinflussen. Beim schrittweisen Hinzufügen der Prädiktoren in Vorwärtsrichtung erhalten Sie die folgenden Ergebnisse.
Modell %Kartoffel Abkühlgeschwindigkeit Frittiertemperatur R2 korrigiertes R2
1 X     52  
1 X X   63 62
3 X X X    

Das erste Modell ergibt ein R2 von über 50 %. Beim zweiten Modell wird der Prädiktor „Abkühlgeschwindigkeit“ hinzugefügt. Das korrigierte R2 nimmt zu, und dies weist darauf hin, dass „Abkühlgeschwindigkeit“ das Modell verbessert. Im dritten Modell, bei dem der Prädiktor „Frittiertemperatur“ hinzugefügt wird, nimmt das R2 zu, jedoch nicht das korrigierte R2. Diese Ergebnisse deuten darauf hin, dass das Modell durch „Frittiertemperatur“ nicht verbessert wird. Auf der Grundlage dieser Ergebnisse erwägen Sie, „Frittiertemperatur“ aus dem Modell zu entfernen.