R-Quadrat vs. Modellauswahlschritt

Wenn Sie die Vorwärtsauswahl mit Validierung als schrittweises Verfahren verwenden, erzeugt Minitab ein Diagramm des R2 für den Trainingsdatensatz und entweder des R2 für den Test oder das R2 für K Faltungen mit schrittweiser Methode für jeden Schritt im Modellauswahlverfahren. Es hängt davon ab, ob Sie einen Testdatensatz oder die Kreuzvalidierung mit K Faltungen verwenden, ab das R2 für den Test oder das R2 für K Faltungen mit schrittweiser Methode angezeigt wird.

Interpretation

Verwenden Sie das Diagramm, um die verschiedenen R2-Werte in den einzelnen Schritten zu vergleichen. In der Regel zeigt das Modell eine gute Leistung, wenn beide R2-Werte groß sind. Minitab zeigt Regressionstatistiken für das Modell aus dem Schritt an, der entweder das R2 für den Test oder das R 2 für K Faltungen mit schrittweiser Methode maximiert. Das Diagramm zeigt, ob einfachere Modelle hinreichend passend sind, sodass auch sie gute potenzielle Modelle sein können.

Bei einer übermäßigen Anpassung eines Modells nimmt das R2 für den Test oder das R2 für K Faltungen mit schrittweiser Methode bei der Aufnahme von Termen in das Modell ab. Eine solche Abnahme erfolgt, während das entsprechende R2 für das Training oder das R2 für alle Daten weiterhin zunimmt. Ein Modell ist übermäßig angepasst, wenn Sie Terme für Effekte hinzufügen, die in der Grundgesamtheit nicht wichtig sind. Ein übermäßig angepasstes Modell eignet sich möglicherweise nicht, um Prognosen zur Grundgesamtheit vorzunehmen. Wenn ein Modell übermäßig angepasst ist, können Sie Modelle aus früheren Schritten untersuchen.

Im folgenden Diagramm wird als Beispiel das R2 für den Test angezeigt. Anfangs liegen beide R2-Werte nahe bei 70 %. In den ersten Schritte nehmen beide R2-Werte bei der Aufnahme von Termen in das Modell tendenziell zu. In Schritt 6 beträgt das R2 für den Test etwa 88 %. Der Maximalwert des R2 für den Test liegt in Schritt 14 vor, mit einem Wert von beinahe 90 %. Sie können überlegen, ob die Verbesserung der Anpassung die zusätzliche Komplexität durch die Aufnahme weiterer Terme in das Modell rechtfertigt.

Nach Schritt 14 nimmt das R2 weiterhin zu, das R2 für den Test hingegen nicht mehr. Die Abnahme des R2 für den Test nach Schritt 14 deutet auf eine übermäßige Anpassung des Modells hin.