Optimierung der Hyperparameter Bestes Modell ermitteln (stetige Antwort)

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Hier finden Sie Definitionen und Anleitungen zur Interpretation der Regressionstabelle.

Nach der Erstellung eines Modells mit Bestes Modell ermitteln (stetige Antwort)können Sie Alternatives Modell auswählen klicken, um andere Modelle zu erkunden. Wenn Sie ein Random Forests® Modell, besteht eine Option darin, Hyperparameter anzugeben, die an neue Modelle angepasst sind. Wenn Sie Hyperparameter angeben, enthalten die Ergebnisse die Tabelle Optimierung von Hyperparametern. In der Tabelle werden die Kombinationen von Hyperparametern verglichen. Die Ergebnisse, die auf die Tabelle Optimierung von Hyperparametern folgen, beziehen sich auf das Modell mit dem besten Wert des Optimalitätskriteriums, z. B. dem maximalen R2.

R-Quadrat

R2 ist der Prozentsatz der Streuung in der Antwortvariablen, den das Modell erklärt.

Interpretation

Verwenden Sie das R2, um zu bestimmen, wie gut das Modell für Ihre Daten passend ist. Je höher das R2, desto besser ist das Modell für Ihre Daten passend. R2 liegt immer zwischen 0 % und 100 %.

Sie können die Bedeutung unterschiedlicher Werte für das R2 grafisch veranschaulichen. Das erste Diagramm veranschaulicht ein einfaches Regressionsmodell, das 85,5 % der Streuung in der Antwortvariablen erklärt. Das zweite Diagramm veranschaulicht ein Modell, das 22,6 % der Streuung in der Antwortvariablen erklärt. Je mehr Streuung durch das Modell erklärt wird, desto näher liegen die Datenpunkte an den angepassten Werten. Wenn ein Modell theoretisch 100 % der Streuung erklären könnte, wären die angepassten Werte immer gleich den beobachteten Werten, und alle Datenpunkte würden auf der Linie y = x liegen.
Hinweis

Da Random Forests® zwar Daten von außerhalb des Segments verwenden, um R2 zu berechnen, aber nicht, um an das Modell anzupassen, ist eine Überanpassung des Modells kein Problem.

Mittlere absolute Abweichung (MAD)

Die mittlere absolute Abweichung (MAD) drückt die Genauigkeit in der gleichen Einheit wie die Daten aus. Auf diese Weise kann der Fehleranteil leichter erfasst werden. Ausreißer haben eine geringere Auswirkung auf die MAD als auf R2.

Interpretation

Hiermit können Sie die Anpassungen verschiedener Modelle vergleichen. Kleinere Werte weisen auf eine bessere Anpassung hin.

Prädiktoranzahl für Knotenaufteilung

Diese Zeile gibt die Auswahl für die Anzahl der zu berücksichtigenden Prädiktoren an.

Minimale interne Knotengröße

Die minimale interne Knotengröße gibt die minimale Anzahl von Fällen an, die ein Knoten aufweisen kann, wenn er immer noch in weitere Knoten geteilt werden kann.

Anzahl der Bootstrap-Stichproben

Die Anzahl der Bootstrap-Stichproben gibt die Anzahl der Bäume in der Analyse an.