Methoden und Formeln für die Optimierung von Hyperparametern in Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Wenn Sie Werte für mehr als einen Hyperparameter angeben, hängen die Modelle in der Auswertungstabelle davon ab, ob Sie die vollständigen Kombinationen der Hyperparameter auswerten.

  • Wenn Sie Auswerten kompletter Parameterkombinationen auswählen, wertet der Algorithmus jede Kombination der Hyperparameter aus. Die Berechnung dieser Option dauert in der Regel länger.
  • Andernfalls wertet der Algorithmus die Hyperparameter in dieser Reihenfolge aus:
    1. Trainingsrate
    2. Fraktion für Teilstichprobe
    3. Individueller Baumkomplexitätsparameter
    Angenommen, der Algorithmus erhält die folgenden Hyperparameter:
    • Trainingsraten: 0,001, 0,01, 0,1
    • Teilstichproben-Fraktionen: 0,4, 0,5, 0,7
    • Maximale Anzahl von Endknoten: 4, 6
    1. Der Algorithmus legt den Anteil der Teilstichprobe auf 0,4 und die maximale Anzahl der Endknoten auf 4 fest. Anschließend wertet der Algorithmus die Trainingsraten in der Reihenfolge vom kleinsten zum größten Wert aus: 0,001, 0,01, 0,1.
    2. Angenommen, der Algorithmus identifiziert 0,01 als die beste Trainingsrate. Dann legt der Algorithmus die Trainingsrate auf 0,01 und die maximale Anzahl von Endknoten auf 4 fest. Anschließend wertet der Algorithmus die Teilstichprobenanteile von 0,4, 0,5 und 0,7 aus.
    3. Angenommen, der Algorithmus identifiziert 0,5 als den besten Teilstichprobenanteil. Dann legt der Algorithmus die Trainingsrate auf 0,01 und den Anteil der Teilstichprobe auf 0,5 fest. Anschließend wertet der Algorithmus die maximale Anzahl von Knoten von 4 und 6 aus.
    4. Angenommen, der Algorithmus identifiziert 6 als die beste maximale Anzahl von Endknoten. Anschließend erstellt Minitab die Auswertungstabelle und die Ergebnisse für das Modell mit Trainingsrate = 0,01, Teilstichprobenanteil 0,5 und maximaler Anzahl von Endknoten = 6.

In diesem Beispiel enthält die Analyse, die nicht den vollständigen Satz von Parameterkombinationen auswertet, 8 Modelle in der Auswertungstabelle. Eine Analyse aller Parameterkombinationen hat 3 × 3 × 2 = 18 Kombinationen und benötigt mehr Rechenzeit.

Details zur Berechnung der Genauigkeitskriterien für ein einzelnes Modell finden Sie unter Methoden und Formeln für die Zusammenfassung des Modells in Anpassen des Modells und Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression.