Ein Forscherteam sammelt Daten aus dem Verkauf einzelner Wohnimmobilien in Ames im US-Bundesstaat Iowa. Die Forscher wollen die Variablen identifizieren, die den Verkaufspreis beeinflussen. Zu den Variablen gehören die Grundstücksgröße und verschiedene Merkmale der Wohnimmobilie. Die Forscher wollen beurteilen, wie gut das beste MARS-Modell® zu den Daten passt.
Wählen Sie Predictive
Analytics-Modul > MARS®-Regression aus.
Geben Sie im Feld Antwort die Spalte 'Verkaufspreis' ein.
Geben Sie in Stetige Prädiktoren'Losfront' – ''Jahr verkauftein.
Geben Sie Typ in Kategoriale Prädiktorenein: 'Verkaufsbedingung'.
Klicken Sie auf OK.
Interpretieren der Ergebnisse
Standardmäßig passt ein additives Modell, MARS®-Regression sodass alle Basisfunktionen in der Regressionsgleichung 1 Prädiktor verwenden. Der erste Prädiktor in der Liste ist BF2. BF2 verwendet den Prädiktor Wohnbereich. Da sich der Prädiktor in der Basisfunktion 1 befindet, hat der Prädiktor 2 verschiedene Steigungen im Modell. Die Funktion max(0, 3078 - Wohnbereich) definiert, dass die Steigung ungleich Null ist, wenn die Wohnfläche kleiner als 3.078 ist.
Hinweis
In diesen Ergebnissen hat die Liste der Basisfunktionen 15 Basisfunktionen, aber die optimale Anzahl von Basisfunktionen ist 13. Die Regressionsgleichung enthält 13 Basisfunktionen. Die Liste der Basisfunktionen enthält BF7 und BF17, die Basisfunktionen, die die fehlenden Werte identifizieren. Diese Basisfunktionen sind für sich genommen nicht wichtig, da sie die nicht so stark reduziert haben wie andere Basisfunktionen in der Suche. Diese 2 Basisfunktionen sind in der Liste enthalten, um die vollständige Berechnung von BF10 und BF 19 anzuzeigen, die wichtig sind.
Zusammenfassung des Modells
Prädiktoren gesamt
77
Wichtige Prädiktoren
10
Maximale Anzahl von Basisfunktionen
30
Optimale Anzahl von Basisfunktionen
13
Statistiken
Schulungen
Test
R-Quadrat
89,61%
87,61%
Wurzel des mittleren quadrierten Fehlers (RMSE)
25836,5197
27855,6550
Mittlerer quadrierter Fehler (MSE)
667525749,7185
775937512,8264
Mittlere abs. Abweichung (MAD)
17506,0038
17783,5549
Die Modellübersichtstabelle enthält Messgrößen für die Leistung des Modells. Sie können diese Werte verwenden, um Modelle zu vergleichen. Für diese Ergebnisse beträgt der Test R-Quadrat etwa 88%.