Prädiktoren gesamt | 77 |
---|---|
Wichtige Prädiktoren | 10 |
Maximale Anzahl von Basisfunktionen | 30 |
Optimale Anzahl von Basisfunktionen | 13 |
Statistiken | Schulungen | Test |
---|---|---|
R-Quadrat | 89,61% | 87,61% |
Wurzel des mittleren quadrierten Fehlers (RMSE) | 25836,5197 | 27855,6550 |
Mittlerer quadrierter Fehler (MSE) | 667525749,7185 | 775937512,8264 |
Mittlere abs. Abweichung (MAD) | 17506,0038 | 17783,5549 |
In diesen Ergebnissen beträgt der Test R-Quadrat etwa 88%. Der mittlere quadratische Fehler der Testwurzel beträgt etwa 27.856. Der mittlere quadratische Fehler des Tests beträgt etwa 775.937.513. Die mittlere absolute Abweichung des Tests beträgt etwa 17.784.
Verwenden Sie das Diagramm zur relativen Variablenwichtigkeit, um zu sehen, welche Prädiktoren die wichtigsten Variablen für das Modell sind.
Wichtige Variablen befinden sich in mindestens 1 Basisfunktion im Modell. Die Variable mit dem höchsten Verbesserungswert wird als wichtigste Variable festgelegt, die übrigen Variablen folgen in entsprechender Reihenfolge. Bei der relativen Variablenwichtigkeit werden die Wichtigkeitswerte standardisiert, sodass sie leichter interpretiert werden können. Die relative Wichtigkeit ist als die prozentuale Verbesserung in Bezug auf den wichtigsten Prädiktor definiert.
Die Werte für die relative variable Wichtigkeit reichen von 0 % bis 100 %. Die wichtigste Variable hat immer eine relative Bedeutung von 100%. Wenn sich eine Variable nicht in einer Basisfunktion befindet, ist diese Variable nicht wichtig.
Obwohl diese Ergebnisse 10 Variablen mit positiver Wichtigkeit umfassen, liefert die relative Rangfolge Informationen darüber, wie viele Variablen für eine bestimmte Anwendung kontrolliert oder überwacht werden müssen. Ein steiler Abfall der relativen Wichtigkeit von einer Variablen zur nächsten Variablen können Ihnen die Entscheidung darüber erleichtern, welche Variablen zu kontrollieren oder zu überwachen sind. Zum Beispiel haben in diesen Daten die 2 wichtigsten Variablen Wichtigkeitswerte, die relativ nahe beieinander liegen, bevor die relative Wichtigkeit zur nächsten Variablen um über 20% abfällt. In ähnlicher Weise haben 2 Variablen ähnliche Wichtigkeitswerte über 60%. Sie können Variablen aus verschiedenen Gruppen entfernen und die Analyse wiederholen, um auszuwerten, wie Variablen in verschiedenen Gruppen die Prognosegenauigkeit in der Tabelle mit der Zusammenfassung des Modells beeinflussen.
Verwenden Sie die partiellen Abhängigkeitsdiagramme, die Basisfunktionen und die Koeffizienten in der Regressionsgleichung, um die Wirkung der Prädiktoren zu bestimmen. Die Auswirkungen der Prädiktoren erklären die Beziehung zwischen den Prädiktoren und der Antwortvariablen. Betrachten Sie alle Basisfunktionen für einen Prädiktor, um die Auswirkungen des Prädiktors auf die Antwortvariable zu verstehen.
Berücksichtigen Sie außerdem die Verwendung der wichtigen Prädiktoren und die Formen ihrer Beziehungen, wenn Sie andere Modelle erstellen. Wenn das MARS®-Regressionsmodell beispielsweise Interaktionen enthält, überlegen Sie, ob diese Interaktionen in ein Regressionsmodell der kleinsten Quadrate einbezogen werden sollen, um die Leistung der beiden Modelltypen zu vergleichen. In Anwendungen, in denen Sie die Prädiktoren steuern, bieten die Effekte eine natürliche Möglichkeit, die Einstellungen zu optimieren, um ein Ziel für die Antwortvariable zu erreichen.
In einem additiven Modell zeigen Ein-Prädiktor-, partielle Abhängigkeitsdiagramme, wie sich die wichtigen kontinuierlichen Prädiktoren auf die vorhergesagte Antwort auswirken. Das Diagramm der partiellen Abhängigkeit bei einem Prädiktor gibt an, wie sich die Antwort variablen Änderungen bei den Prädiktorebenen voraussichtlich ändert. Für MARS®-Regressionstammen die Werte im Diagramm aus den Basisfunktionen für den Prädiktor auf der x-Achse. Der Beitrag auf der y-Achse ist standardisiert, so dass der Mindestwert auf dem Diagramm 0 ist.
Dieses Diagramm veranschaulicht, dass dies zunimmt, Verkaufspreis wenn die Wohnbereich minimale Quadratmeterzahl im Datensatz auf etwa 3.000 Quadratfuß steigt. Nach Wohnbereich dem Erreichen von 3.000 Quadratfuß wird der Beitrag Verkaufspreis bei etwa 152.000 US-Dollar flach.
In diesen Ergebnissen hat BF2 einen negativen Koeffizienten in der Regressionsgleichung. Der Koeffizient für die Basisfunktion ist −57,6167. Die Anordnung der Basisfunktion ist max(0, c − X). In dieser Anordnung nimmt der Wert der Basisfunktion ab, wenn der Prädiktor zunimmt. Die Kombination dieser Anordnung und des negativen Koeffizienten erzeugt eine positive Beziehung zwischen der Prädiktorvariablen und der Antwortvariablen. Die Steigung von ist 57.6167 von Wohnbereich 438 bis 3,078.
Weitere Beispiele für allgemeine Basisfunktionen finden Sie unter Regressionsgleichung für MARS®-Regression.