Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.
Ein Forscherteam sammelt Daten aus dem Verkauf einzelner Wohnimmobilien in Ames im US-Bundesstaat Iowa. Die Forscher wollen die Variablen identifizieren, die den Verkaufspreis beeinflussen. Zu den Variablen gehören die Grundstücksgröße und verschiedene Merkmale der Wohnimmobilie.
Nach der ersten Untersuchung mit CART® Regression zur Identifizierung der wichtigen Prädiktoren verwendet das Team Random Forests® Regression, um ein intensiveres Modell aus demselben Datensatz zu erstellen. Das Team vergleicht die Tabelle mit der Zusammenfassung des Modells und das R2-Diagramm aus den Ergebnissen, um zu bewerten, welches Modell ein besseres Prognoseergebnis liefert.
Diese Daten sind eine Adaption eines öffentlichen Datensatzes, der Informationen zur Wohnsituation in Ames enthält. Originaldaten von DeCock, Truman State University.
Modellvalidierung | Validierung mit Daten von außerhalb des Segments |
---|---|
Anzahl der Bootstrap-Stichproben | 300 |
Stichprobenumfang | Entspricht Umfang der Trainingsdaten von 2930 |
Anzahl der für die Knotenteilung ausgewählten Prädiktoren | 30% der Gesamtanzahl der Prädiktoren = 23 |
Minimale interne Knotengröße | 5 |
Verwendete Zeilen | 2930 |
Mittelwert | StdAbw | Minimum | Q1 | Median | Q3 | Maximum |
---|---|---|---|---|---|---|
180796 | 79886,7 | 12789 | 129500 | 160000 | 213500 | 755000 |
Prädiktoren gesamt | 77 |
---|---|
Wichtige Prädiktoren | 68 |
Statistiken | Außerhalb des Segments |
---|---|
R-Quadrat | 90,90% |
Wurzel des mittleren quadrierten Fehlers (RMSE) | 24097,3281 |
Mittlerer quadrierter Fehler (MSE) | 5,80681E+08 |
Mittlere abs. Abweichung (MAD) | 14746,8323 |
Mittlerer absoluter prozentualer Fehler (MAPE) | 0,0895 |
Die Tabelle mit der Zusammenfassung des Modells zeigt, dass dieR2-Werte gegenüber den R2-Werten der entsprechenden CART®-Analyse leicht verbessert sind.