Modellzusammenfassungstabelle für Regressionsmodell anpassen und Lineare Regression

Hier finden Sie Definitionen und Anleitungen zur Interpretation für jede Statistik in der Tabelle mit der Zusammenfassung des Modells.

S

S stellt die Standardabweichung der Distanz zwischen den Datenwerten und den angepassten Werten dar. S wird in der Maßeinheit der Antwortvariablen ausgedrückt.

Interpretation

Verwenden Sie S, um zu ermitteln, wie genau das Modell die Antwortvariable beschreibt. S wird in der Maßeinheit der Antwortvariablen ausgedrückt und stellt den Abstand der Datenwerte von den angepassten Werten dar. Je niedriger der Wert von S, desto genauer beschreibt das Modell die Antwortvariable. Ein niedriger Wert von S allein bedeutet jedoch nicht zwangsläufig, dass das Modell die Modellannahmen erfüllt. Prüfen Sie die Annahmen anhand der Residuendiagramme.

Angenommen, Sie sind für einen Hersteller von Kartoffelchips tätig, der die Faktoren untersucht, die den Prozentsatz der zerkrümelten Kartoffelchips in jeder Packung beeinflussen. Sie reduzieren das Modell auf die signifikanten Prädiktoren, und für S wird der Wert 1,79 berechnet. Dieses Ergebnis gibt an, dass die Standardabweichung der Datenpunkte um die angepassten Werte 1,79 beträgt. Beim Vergleichen von Modellen weisen Werte kleiner als 1,79 auf eine bessere und Werte größer als 1,79 auf eine schlechtere Anpassung hin.

R-Qd

R2 gibt den Prozentsatz der Streuung der Antwortvariablen an, der durch das Modell erklärt wird. Der Wert wird wie folgt berechnet: 1 minus das Verhältnis zwischen der Summe der quadrierten Fehler (Streuung, die durch das Modell nicht erklärt wird) zur Gesamtsumme der Quadrate (Gesamtstreuung im Modell).

Interpretation

Verwenden Sie das R2, um zu ermitteln, wie gut das Modell an die Daten angepasst ist. Je höher das R2, desto besser ist das Modell an die Daten angepasst. Das R2 liegt immer zwischen 0 % und 100 %.

Sie können eine Darstellung der Anpassungslinie verwenden, um verschiedene Werte von R2 grafisch zu veranschaulichen. Das erste Diagramm zeigt ein einfaches Regressionsmodell, das 85,5 % der Streuung der Antwortvariablen erklärt. Das zweite Diagramm zeigt ein Modell, das 22,6 % der Streuung der Antwortvariablen erklärt. Je größer der vom Modell erklärte Anteil der Streuung, desto näher liegen die Datenpunkte an der angepassten Regressionslinie. Würde ein Modell theoretisch 100 % der Streuung erklären, wären die angepassten Werte immer gleich den beobachteten Werten, und sämtliche Datenpunkte würden auf der Anpassungslinie liegen. Selbst bei einem R2 von 100 % werden neue Beobachtungen vom Modell jedoch nicht unbedingt genau prognostiziert.
Beachten Sie beim Interpretieren des R2-Werts Folgendes:
  • Der Wert von R2 nimmt beim Einbinden zusätzlicher Prädiktoren in das Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist R2 am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

  • Kleine Stichproben ermöglichen keinen genauen Schätzwert für die Stärke der Beziehung zwischen der Antwortvariablen und den Prädiktoren. Wenn z. B. das R2 genauer sein muss, sollten Sie einen größeren Stichprobenumfang (im Allgemeinen 40 oder mehr) wählen.

  • Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme untersuchen, um sich zu vergewissern, dass das Modell die Modellannahmen erfüllt.

R-Qd(kor)

Das korrigierte R2 gibt den Prozentsatz der Streuung der Antwortvariablen an, der vom Modell erklärt wird, korrigiert nach der Anzahl der Prädiktoren im Modell in Bezug auf die Anzahl der Beobachtungen. Das korrigierte R2 wird als 1 minus dem Verhältnis zwischen dem mittleren quadrierten Fehler (MSE) und dem Gesamtmittel der Quadrate (MS Gesamt) berechnet.

Interpretation

Verwenden Sie das korrigierte R2, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. R2 nimmt stets zu, wenn Sie einen zusätzlichen Prädiktor in das Modell aufnehmen, selbst wenn damit keine tatsächliche Verbesserung des Modells verbunden ist. Der Wert des korrigierten R2 berücksichtigt die Anzahl der Prädiktoren im Modell, so dass Ihnen das Auswählen des richtigen Modells erleichtert wird.

Angenommen, Sie sind für einen Hersteller von Kartoffelchips tätig, der die Faktoren untersucht, die den Prozentsatz der zerkrümelten Kartoffelchips in jeder Packung beeinflussen. Beim schrittweisen Hinzufügen der Prädiktoren in Vorwärtsrichtung erhalten Sie die folgenden Ergebnisse.
Modell %Kartoffel Abkühlgeschwindigkeit Frittiertemperatur R2 korrigiertes R2
1 X     52  
1 X X   63 62
3 X X X    

Das erste Modell ergibt ein R2 von über 50 %. Beim zweiten Modell wird der Prädiktor „Abkühlgeschwindigkeit“ hinzugefügt. Das korrigierte R2 nimmt zu, und dies weist darauf hin, dass „Abkühlgeschwindigkeit“ das Modell verbessert. Im dritten Modell, bei dem der Prädiktor „Frittiertemperatur“ hinzugefügt wird, nimmt das R2 zu, jedoch nicht das korrigierte R2. Diese Ergebnisse deuten darauf hin, dass das Modell durch „Frittiertemperatur“ nicht verbessert wird. Auf der Grundlage dieser Ergebnisse erwägen Sie, „Frittiertemperatur“ aus dem Modell zu entfernen.

PRESS

Die Summe der quadrierten Prognosefehler (PRESS) ist ein Maß der Abweichung zwischen den angepassten Werten und den beobachteten Werten. PRESS ähnelt der Summe der Quadrate der Residuenfehler (SSE), d. h. der Summe der quadrierten Residuen. Die Berechnung der Residuen für PRESS erfolgt jedoch nach einem anderen Verfahren. PRESS wird mit einer Formel berechnet, die diesem Verfahren entspricht: Jede einzelne Beobachtung wird systematisch aus dem Datensatz entfernt, die Regressionsgleichung wird geschätzt, und es wird ermittelt, wie genau das Modell die entfernte Beobachtung prognostiziert.

Interpretation

Verwenden Sie PRESS, um die Prognosefähigkeit des Modells zu beurteilen. Im Allgemeinen gilt: Je kleiner der PRESS-Wert, desto besser ist die Prognosefähigkeit des Modells. Minitab verwendet PRESS, um das prognostizierte R2 zu berechnen, das im Allgemeinen intuitiver zu interpretieren ist. Kombiniert können diese Statistiken eine übermäßige Anpassung des Modells verhindern. Ein übermäßig angepasstes Modell liegt vor, wenn Sie Terme für Effekte hinzufügen, die in der Grundgesamtheit unbedeutend sind, obwohl sie in den Stichprobendaten als wichtig erscheinen. Das Modell wird somit an die Stichprobendaten angepasst und ist daher möglicherweise beim Aufstellen von Prognosen für die Grundgesamtheit nicht nützlich.

R-Qd(prog)

Das prognostizierte R2 wird mit einer Formel berechnet, die diesem Verfahren entspricht: Jede einzelne Beobachtung wird systematisch aus dem Datensatz entfernt, die Regressionsgleichung wird geschätzt, und es wird ermittelt, wie genau das Modell die jeweils entfernte Beobachtung prognostiziert. Der Wert des prognostizierten R2 liegt im Bereich von 0 % bis 100 %. (Obwohl die Berechnungen für das prognostizierte R2 negative Werte ergeben können, zeigt Minitab in derartigen Fällen null an.)

Interpretation

Verwenden Sie das prognostizierte R2, um zu ermitteln, wie genau das Modell Werte der Antwortvariablen für neue Beobachtungen prognostiziert. Modelle mit einem höheren prognostizierten R2 zeichnen sich durch eine bessere Prognosefähigkeit aus.

Ein prognostiziertes R2, das wesentlich kleiner als R2 ist, kann auf eine übermäßige Anpassung des Modells hinweisen. Ein übermäßig angepasstes Modell liegt vor, wenn Sie Terme für Effekte hinzufügen, die in der Grundgesamtheit unbedeutend sind. Das Modell wird somit an die Stichprobendaten angepasst und ist daher möglicherweise beim Aufstellen von Prognosen für die Grundgesamtheit nicht nützlich.

Das prognostizierte R2 kann zudem beim Vergleichen von Modellen nützlicher als das korrigierte R2 sein, da der Wert mit Beobachtungen berechnet wird, die in der Modellberechnung nicht enthalten sind.

Ein Analytiker bei einem Finanzberatungsunternehmen entwickelt beispielsweise ein Modell zum Prognostizieren künftiger Marktbedingungen. Das Modell sieht vielversprechend aus, denn es weist ein R2 von 87 % auf. Das prognostizierte R2 beträgt hingegen lediglich 52 %, was darauf hinweist, dass das Modell möglicherweise übermäßig angepasst ist.

AICc und BIC

Akaikes korrigiertes Informationskriterium (AICc) und das Bayessche Informationskriterium (BIC) sind Maße der relativen Qualität eines Modells, bei dem sowohl die Anpassung als auch die Anzahl der Terme im Modell berücksichtigt werden.

Interpretation

Anhand des AICc und des BIC können Sie verschiedene Modelle vergleichen. Erwünscht sind kleinere Werte. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie auch die Tests und Residuendiagramme, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.

Sowohl AICc als auch BIC werten die Likelihood des Modells aus und wenden dann einen Abzug für das Hinzufügen von Termen zum Modell an. Durch den Abzug wird die Tendenz zur Überanpassung des Modells an die Stichprobendaten reduziert. Durch diese Reduzierung kann ein Modell zustande kommen, das insgesamt eine bessere Leistung erbringt.

Als Faustregel gilt: Wenn die Anzahl der Parameter im Verhältnis zum Stichprobenumfang klein ist, ist der Abzug für das Hinzufügen der einzelnen Parameter für BIC größer als für AICc. In diesen Fällen ist das Modell, bei dem BIC minimiert wird, tendenziell kleiner als das Modell, bei dem AICc minimiert wird.

In einigen gängigen Fällen, z. B. bei Screening-Versuchsplänen, ist die Anzahl der Parameter im Verhältnis zum Stichprobenumfang in der Regel groß. In diesen Fällen ist das Modell, bei dem AICc minimiert wird, tendenziell kleiner als das Modell, bei dem BIC minimiert wird. Bei einem definitiven Screening-Versuchsplan mit 13 Durchläufen ist beispielsweise in der Gruppe der Modelle mit 6 oder mehr Parametern das Modell, bei dem AICc minimiert wird, tendenziell kleiner als das Modell, bei dem BIC minimiert wird.

Weitere Informationen zu AICc und BIC finden Sie in Burnham und Anderson.1

S für Test

Das S für den Test fasst den Abstand zwischen den Datenwerten und den angepassten Werten im Testdatensatz zusammen. Das S für den Test wird in den Einheiten der Antwortvariablen gemessen.

Interpretation

Verwenden Sie das S für den Test, um die Leistung des Modells in Bezug auf neue Daten auszuwerten. Je niedriger das S für den Test, desto näher liegen die Prognosen des Modells an den tatsächlichen Werten im Testdatensatz.

Ein S, das wesentlich kleiner als das S für den Test ist, kann darauf hinweisen, kann auf eine übermäßige Anpassung des Modells hinweisen. Ein Modell ist übermäßig angepasst, wenn Sie Terme für Effekte hinzufügen, die in der Grundgesamtheit nicht wichtig sind. Das Modell wird auf die Stichprobendaten zugeschnitten und ist daher möglicherweise nicht nützlich, um Prognosen zur Grundgesamtheit zu treffen.

Angenommen, Sie arbeiten für einen Hersteller von Kartoffelchips und untersuchen die Faktoren, die sich auf den Prozentsatz der zerbröselten Chips pro Behälter auswirken. Sie reduzieren das Modell auf die signifikanten Prädiktoren und stellen fest, dass S gleich 1,79 ist, S für den Test jedoch gleich 17,63 ist. Da sich das S für den Test stark vom S für den Trainingsdatensatz unterscheidet, entscheiden Sie, dass das S den Test einen besseren Hinweis auf die Leistung des Modells bei neuen Daten liefert.

Ein niedriges S für den Test allein weist nicht darauf hin, dass das Modell die Modellannahmen erfüllt. Sie sollten die Residuendiagramme untersuchen, um die Annahmen zu überprüfen.

R-Qd für Test

Das R2 für den Test ist der Prozentsatz der Streuung in der Antwortvariablen des Testdatensatzes, der durch das Modell erklärt wird. Das R2 für den Test kann Werte von 0 % bis 100 % annehmen. (Die Berechnungen für das R2 für den Test können zwar negative Werte ergeben, die Minitab Statistical Software zeigt jedoch für diese Fälle 0 an.)

Interpretation

Verwenden Sie das R2 für den Test, um zu bestimmen, wie gut Ihr Modell für neue Daten passend ist. Modelle mit einem größeren R2 für den Test haben bei neuen Daten eine tendenziell bessere Leistung. Sie können das R2 für den Test verwenden, um die Leistung verschiedener Modelle zu vergleichen.

Ein R2 für den Test, das wesentlich kleiner als das R2 ist, kann auf eine übermäßige Anpassung des Modells hinweisen. Ein Modell ist übermäßig angepasst, wenn Sie Terme für Effekte hinzufügen, die in der Grundgesamtheit nicht wichtig sind. Das Modell wird auf die Trainingsdaten zugeschnitten und ist daher möglicherweise nicht nützlich, um Prognosen zur Grundgesamtheit zu treffen.

Angenommen, ein Analyst bei einem Finanzberatungsunternehmen entwickelt ein Modell, um zukünftige Marktbedingungen zu prognostizieren. Das Modell sieht vielversprechend aus, weil es ein R2 von 87 % aufweist. Das R2 für den Test beträgt jedoch 52 %, was auf eine übermäßige Anpassung des Modells hinweist.

Ein hohes R2 für den Test allein weist nicht darauf hin, dass das Modell die Modellannahmen erfüllt. Sie sollten die Residuendiagramme untersuchen, um die Annahmen zu überprüfen.

S für K Faltungen

Das S für K Faltungen fasst den Abstand zwischen den Datenwerten und den angepassten Werten im Testdatensatz zusammen. Das S für K Faltungen wird in den Einheiten der Antwortvariablen gemessen.

Interpretation

Verwenden Sie das S für K Faltungen, um die Leistung des Modells in Bezug auf neue Daten auszuwerten. Je niedriger der Wert von S für K Faltungen, desto näher liegen die Prognosen des Modells an den tatsächlichen Werten in der Faltung, wenn die Daten in der Faltung nicht Teil der Schätzung des Modells sind.

Ein S, das wesentlich kleiner als das S für K Faltungen ist, kann auf eine übermäßige Anpassung des Modells hinweisen. Ein Modell ist übermäßig angepasst, wenn Sie Terme für Effekte hinzufügen, die in der Grundgesamtheit nicht wichtig sind. Das Modell wird auf die Stichprobendaten zugeschnitten und ist daher möglicherweise nicht nützlich, um Prognosen zur Grundgesamtheit zu treffen.

Angenommen, Sie arbeiten für einen Hersteller von Kartoffelchips und untersuchen die Faktoren, die sich auf den Prozentsatz der zerbröselten Chips pro Behälter auswirken. Sie reduzieren das Modell auf die signifikanten Prädiktoren und stellen fest, dass S gleich 1,79 ist, S für K Faltungen jedoch gleich 17,63 ist. Da sich das S für K Faltungen stark vom S für den Trainingsdatensatz unterscheidet, entscheiden Sie, dass das S für K Faltungen einen besseren Hinweis auf die Leistung des Modells bei neuen Daten liefert.

Ein niedriges S für K Faltungen allein weist nicht darauf hin, dass das Modell die Modellannahmen erfüllt. Sie sollten die Residuendiagramme untersuchen, um die Annahmen zu überprüfen.

R-Qd für K Faltungen

Das R2 für K Faltungen ist der Prozentsatz der Streuung in der Antwortvariablen der Datenfaltungen, der durch das Modell erklärt wird. Das R2 für K Faltungen kann Werte von 0 % bis 100 % annehmen. (Die Berechnungen für das R2 für K Faltungen können zwar negative Werte ergeben, die Minitab Statistical Software zeigt jedoch für diese Fälle 0 an.)

Interpretation

Bestimmen Sie anhand des R2 für K Faltungen, wie gut Ihr Modell für neue Daten passend ist. Modelle mit einem größeren R2 für K Faltungen haben bei neuen Daten eine tendenziell bessere Leistung. Sie können das R2 für K Faltungen verwenden, um die Leistung verschiedener Modelle zu vergleichen.

Ein R2 für K Faltungen, das wesentlich kleiner als das R2 ist, kann auf eine übermäßige Anpassung des Modells hinweisen. Ein Modell ist übermäßig angepasst, wenn Sie Terme für Effekte hinzufügen, die in der Grundgesamtheit nicht wichtig sind. Das Modell wird auf die Trainingsdaten zugeschnitten und ist daher möglicherweise nicht nützlich, um Prognosen zur Grundgesamtheit zu treffen.

Angenommen, ein Analyst bei einem Finanzberatungsunternehmen entwickelt ein Modell, um zukünftige Marktbedingungen zu prognostizieren. Das Modell sieht vielversprechend aus, weil es ein R2 von 87 % aufweist. Das R2 für K Faltungen beträgt jedoch 52 %, was auf eine übermäßige Anpassung des Modells hinweist.

Ein hohes R2 für K Faltungen allein weist nicht darauf hin, dass das Modell die Modellannahmen erfüllt. Sie sollten die Residuendiagramme untersuchen, um die Annahmen zu überprüfen.

R-Qd für K Faltungen mit schrittweiser Methode

Das R-Qd für K Faltungen mit schrittweiser Methode wertet die Anzahl der Terme in einem Modell aus einer Reihe von potenziellen Termen aus. Minitab zeigt negative Werte für das R-Qd für K Faltungen mit schrittweiser Methode an, wenn sie auftreten.

Interpretation

Verwenden Sie das R2 für K Faltungen mit schrittweiser Methode, um die Anzahl der Terme in einem Modell zu bestimmen. Minitab berechnet das R-Qd für K Faltungen mit schrittweiser Methode, wenn Sie die Vorwärtsauswahl mit Validierung mit der Kreuzvalidierung mit K Faltungen durchführen. Das R2 für K Faltungen mit schrittweiser Methode wird aus separaten Vorwärtsauswahlen für jede Faltung erhalten. Minitab verwendet das R2 für K Faltungen mit schrittweiser Methode, um den besten Schritt in der Vorwärtsauswahl zu bestimmen. Sobald die Vorwärtsauswahl für jede Faltung abgeschlossen ist, führt Minitab die Vorwärtsauswahl für den vollständigen Datensatz durch. Mit dem vollständigen Datensatz erzeugt Minitab Regressionsergebnisse für das Modell im besten Schritt entsprechend dem Kriterium des R2 für K Faltungen mit schrittweiser Methode.

Um die Prognosefähigkeit eines Modells mit Kreuzvalidierung mit K Faltungen zu bestimmen, verwenden Sie stattdessen das R2 für K Faltungen.

Mallows-Cp

Mallows-Cp kann Sie dabei unterstützen, eine Auswahl zwischen mehreren konkurrierenden Regressionsmodellen zu treffen. Das Mallows-Cp stellt einen Vergleich zwischen dem vollständigen Modell und Modellen mit Teilmengen von Prädiktoren dar. Dieses Maß unterstützt Sie beim Ermitteln einer ausgeglichenen Anzahl von Prädiktoren im Modell. Ein Modell mit zu vielen Prädiktoren kann relativ ungenau sein, während ein Modell mit zu wenigen Prädiktoren verzerrte Schätzwerte ergeben kann. Ein Vergleich von Regressionsmodellen unter Verwendung des Mallows-Cp ist nur gültig, wenn Sie mit dem gleichen vollständigen Satz von Prädiktoren beginnen.

Interpretation

Ein Mallows-Cp, das annähernd gleich der Anzahl der Prädiktoren plus der Konstanten ist, weist darauf hin, dass das Modell relativ genaue und unverzerrte Schätzwerte liefert.

Ein Mallows-Cp, das größer als die Anzahl der Prädiktoren plus der Konstanten ist, weist darauf hin, dass das Modell verzerrt und nicht gut an die Daten angepasst ist.

1 Burnham, K. P., & Anderson, D. R. (2004). Multimodel inference: Understanding AIC and BIC in model selection. Sociological Methods & Research, 33(2), 261-304. doi:10.1177/0049124104268644