Regressionstabelle für MARS®-Regression

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Hier finden Sie Definitionen und Anleitungen zur Interpretation der Regressionstabelle.

Kriterium für die Auswahl des besten Modells

Das Kriterium MARS®-Regression , das zum Erstellen des Modells verwendet wird. MARS®-Regression verwendet entweder das maximale R-Quadrat (Standard) oder die kleinste mittlere absolute Abweichung, um das beste Modell auszuwählen. Das Kriterium der mittleren absoluten Abweichung versucht, den Einfluss der Punkte mit den schlechtesten Anpassungen im Vergleich zum R-Quadrat-Kriterium zu verringern.

Modellvalidierung

MARS®-Regression Verwendet die Kreuzvalidierungsmethode oder einen separaten Testsatz, um das Modell zu validieren. Mit der Kreuzvalidierung können Sie die Zeilen für jede Faltung angeben oder eine Zufallsauswahl zulassen. Mit einem separaten Testdatensatz können Sie die Zeilen für Trainings- und Testdatensätze angeben oder eine Zufallsauswahl zulassen.

Maximale Anzahl von Basisfunktionen

Die Analyse passt sich dieser Anzahl von Basisfunktionen an, bevor die Rückwärtseliminierung von Basisfunktionen verwendet wird, um das beste Modell auszuwählen. Der Standardwert ist 30. Größere Werte weisen darauf hin, dass die Analyse eine gründlichere Suche nach dem optimalen Modell durchgeführt hat.

Minimale Anzahl von Beobachtungen zwischen Knoten

Ein Knoten ist ein Datenpunkt, an dem sich die Basisfunktionen ändern. Standardmäßig verwendet die Analyse den Stichprobenumfang und die Modellkomplexität, um automatisch eine Mindestanzahl auszuwählen. Andernfalls zeigt die Tabelle die spezifische Nummer für die Analyse an. Der Wert 1 gibt an, dass aufeinanderfolgende Datenpunkte Punkte sein können, bei denen sich die Basisfunktion ändert. Der Wert 1 ermöglicht die schnellsten Änderungen in den Modellvorhersagen. Berücksichtigen Sie verschiedene Werte, um die Auswirkungen auf die Anpassung des Modells zu sehen. Beispielsweise erzeugen größere Werte für einige Daten glattere Modelle, bei denen die Wahrscheinlichkeit einer Überanpassung der Trainingsdaten geringer ist. Solche glatteren Modelle sind manchmal über bestimmte Datenbereiche hinweg weniger genau.

Verwendete Zeilen

Die Anzahl der Beobachtungen der Antwortvariablen in der Analyse zum Anpassen und Auswerten des Modells.

Nicht verwendete Zeilen

Die Anzahl der fehlenden Beobachtungen in der Antwortvariablen. Dazu gehören auch fehlende Werte oder Nullen in der Gewichtungsspalte.