Fügt dem Modell schrittweise Terme hinzu bzw. entfernt schrittweise Terme aus dem Modell, um eine nützliche Teilmenge von Termen zu ermitteln. Bei Auswahl eines schrittweisen Verfahrens sind die im Dialogfeld Modell angegebenen Terme potenzielle Terme für das endgültige Modell. Weitere Informationen finden Sie unter Verwenden der schrittweisen Regression und der Regression der besten Teilmengen.
Bei der Kreuzvalidierung wird die Vorwärtsauswahl für jede Faltung wiederholt. Das Verfahren wertet in jedem Schritt alle Faltungen aus und identifiziert den Schritt mit dem besten R2 für K Faltungen mit schrittweiser Methode. Abschließend wird im Verfahren eine Vorwärtsauswahl für den gesamten Datensatz durchgeführt, wobei bei dem besten Schritt aus den Auswahlen für die Faltungen angehalten wird.
Bei beiden Validierungstypen wird das Verfahren unter denselben Bedingungen wie beim Vorwärts-Informationskriterium beendet.
Die im endgültigen Modell enthaltenen Terme können von Hierarchieeinschränkungen für Modelle abhängen. Weitere Informationen finden Sie im untenstehenden Thema „Hierarchie“.
Geben Sie an, welches Informationskriterium bei der Vorwärtsauswahl verwendet werden soll.
Sowohl AICc als auch BIC werten die Likelihood des Modells aus und wenden dann einen Abzug für das Hinzufügen von Termen zum Modell an. Durch den Abzug wird die Tendenz zur Überanpassung des Modells an die Stichprobendaten reduziert. Durch diese Reduzierung kann ein Modell zustande kommen, das insgesamt eine bessere Leistung erbringt.
Als Faustregel gilt: Wenn die Anzahl der Parameter im Verhältnis zum Stichprobenumfang klein ist, ist der Abzug für das Hinzufügen der einzelnen Parameter für BIC größer als für AICc. In diesen Fällen ist das Modell, bei dem BIC minimiert wird, tendenziell kleiner als das Modell, bei dem AICc minimiert wird.
In einigen gängigen Fällen, z. B. bei Screening-Versuchsplänen, ist die Anzahl der Parameter im Verhältnis zum Stichprobenumfang in der Regel groß. In diesen Fällen ist das Modell, bei dem AICc minimiert wird, tendenziell kleiner als das Modell, bei dem BIC minimiert wird. Bei einem definitiven Screening-Versuchsplan mit 13 Durchläufen ist beispielsweise in der Gruppe der Modelle mit 6 oder mehr Parametern das Modell, bei dem AICc minimiert wird, tendenziell kleiner als das Modell, bei dem BIC minimiert wird.
Weitere Informationen zum AICc und BIC finden Sie in Burnham und Anderson.1
Einstellungen für die Validierung befinden sich auch im Unterdialogfeld Validierung. Wenn Sie die Einstellungen ändern, aktualisiert Minitab automatisch die Einstellungen an beiden Orten.
Wenn Sie die Option Vorwärtsauswahl mit Validierung aktivieren, wählen Sie die Validierungsmethode zum Testen Ihres Modells aus. Normalerweise ist bei kleineren Stichproben die Kreuzvalidierung mit K Faltungen geeignet. Bei größeren Stichproben können Sie die Daten in einen Trainingsdatensatz und einen Testdatensatz unterteilen.
Führen Sie die folgenden Schritte aus, um die Kreuzvalidierung mit K Faltungen zu verwenden.
Führen Sie die folgenden Schritte aus, um die Daten in einen Trainingsdatensatz und einen Testdatensatz zu unterteilen.
Sie können bestimmen, wie Minitab die Modellhierarchie während einer schrittweisen Regression erzwingt. Die Schaltfläche Hierarchie ist deaktiviert, wenn Sie im Dialogfeld Modell ein nicht hierarchisches Modell angeben.
In einem hierarchischen Modell sind alle Terme niedriger Ordnung, aus denen sich die Terme höherer Ordnung zusammensetzen, ebenfalls im Modell enthalten. Ein Modell, das den Wechselwirkungsterm A*B*C enthält, ist beispielsweise hierarchisch, wenn es diese Terme umfasst: A, B, C, A*B, A*C und B*C.
Die Modelle müssen nicht zwangsläufig hierarchisch sein. Im Allgemeinen können Sie Terme niedriger Ordnung entfernen, wenn sie nicht signifikant sind, es sei denn, Sie entscheiden aufgrund Ihrer Sachkenntnis, sie beizubehalten. Modelle mit zu vielen Termen können relativ unpräzise sein und die Fähigkeit mindern, die Werte neuer Beobachtungen zu prognostizieren.
Wenn Sie Vorwärtsauswahl mit Validierung auswählen, wird für jeden Schritt in der Vorwärtsauswahl ein Diagramm der R2-Werte für Training und Validierung angezeigt. In der Regel wird das Diagramm verwendet, um zu ermitteln, ob einfachere Modelle ähnliche Validierungswerte aufweisen.