Führen Sie aus. Klicken Sie auf Optimieren von Hyperparametern in den Ergebnissen.
Führen Sie aus. Klicken Sie auf die Schaltfläche Alternatives Modell auswählen in den Ergebnissen.
Dieser Befehl ist mit Predictive Analytics-Modul. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.
Die Leistung von TreeNet®-Modellen hängt im Allgemeinen von den Werte der Trainingsrate, der Fraktion für die Teilstichprobe und der Komplexität der einzelnen Bäume ab, die das Modell bilden. Klicken Sie in den Ergebnissen für ein Modell auf Optimieren von Hyperparametern, um mehrere Werte dieser Hyperparameter auszuwerten und zu erfahren, welche Kombination die besten Werte eines Genauigkeitskriteriums ergibt, z. B. die durchschnittliche –Log-Likelihood. Bessere Werte dieser Hyperparameter haben das Potenzial, die Prognosegenauigkeit deutlich zu verbessern, daher ist die Untersuchung verschiedener Werte ein üblicher Schritt in der Analyse.
Sie können auch die Anzahl der Bäume anpassen, die das Modell enthält. In der Regel funktioniert die Analyse gut, wenn man alle Prädiktoren an jedem Knoten berücksichtigt. Einige Datensätze weisen jedoch Assoziationen zwischen den Prädiktoren auf, die zu einer verbesserten Modellleistung führen, wenn die Analyse eine andere zufällige Teilmenge von Prädiktoren an jedem Knoten berücksichtigt.
Im Allgemeinen reichen 300 Bäume aus, um die Werte der Hyperparameter zu unterscheiden. Im Allgemeinen erhöhen Sie die Anzahl der Bäume, wenn die optimale Anzahl von Bäumen für ein oder mehrere als relevant erachtete Modelle nahe an der maximalen Anzahl von Bäumen liegt. Wenn die Anzahl der Bäume näher an der maximalen Anzahl liegt, ist die Wahrscheinlichkeit größer, dass eine Erhöhung der Anzahl der Bäume die Leistung des Modells verbessert.
Geben Sie einen oder mehrere Werte für jeden auszuwertenden Hyperparameter ein. Die Analyse wertet die Hyperparameter aus, um die Kombination mit dem besten Wert des Genauigkeitskriteriums zu finden. Wenn Sie keine Werte für einen Hyperparameter eingeben, verwendet die Auswertung den Wert für diesen Hyperparameter aus dem Modell in den Ergebnissen. Wenn die Antwort binär ist und das ursprüngliche Modell den Anteil der Ereignisse und Nicht-Ereignisse für die Stichprobe angibt, verwendet die Auswertung immer die Anteile aus dem ursprünglichen Modell.
Geben Sie bis zu 10 Werte ein. Geeignete Werte liegen zwischen 0,0001 und 1.
Geben Sie bis zu 10 Werte ein. Zulässige Werte sind größer als 0 und kleiner als oder gleich 1.
Fraktion für Teilstichprobe wird deaktiviert, wenn das ursprüngliche Modell den Anteil der Ereignisse und Nicht-Ereignisse an der Stichprobe für eine binäre Antwort angibt.
Geben Sie bis zu 3 Werte ein. Die zulässigen Werte liegen zwischen 1 und der Gesamtzahl der Prädiktoren. In der Regel funktioniert die Analyse gut, wenn man die Gesamtzahl der Prädiktoren betrachtet. Einige Datensätze weisen jedoch Assoziationen zwischen den Prädiktoren auf, die zu einer verbesserten Modellleistung führen, wenn die Analyse für jeden Knoten eine kleinere Anzahl von Prädiktoren berücksichtigt.
Geben Sie einen Wert zwischen 1 und 5000 ein, um die maximale Anzahl der zu bauenden Bäume anzugeben. Der Standardwert 300 liefert in der Regel nützliche Ergebnisse für die Auswertung der Hyperparameterwerte.
Wenn ein oder mehrere der als relevant erachteten Modelle über eine Anzahl von Bäumen verfügen, die in der Nähe der von Ihnen angegebenen Anzahl von Bäumen liegt, sollten Sie überlegen, ob Sie die Anzahl der Bäume erhöhen wollen. Wenn die Anzahl der Bäume näher an der maximalen Anzahl liegt, ist die Wahrscheinlichkeit größer, dass eine Erhöhung der Anzahl der Bäume die Leistung des Modells verbessert.
In diesem Beispiel enthält die Analyse, die nicht den vollständigen Satz von Parameterkombinationen auswertet, 8 Modelle in der Auswertungstabelle. Eine Analyse aller Parameterkombinationen hat 3 × 3 × 2 = 18 Kombinationen und benötigt mehr Rechenzeit.
Nachdem Sie die zu untersuchenden Werte angegeben haben, klicken Sie auf Anzeigen der Ergebnisse. In einem neuen Satz von Ergebnissen erstellt Minitab eine Tabelle, in der das Genauigkeitskriterium für die Hyperparameterkombinationen und die Ergebnisse für das Modell mit dem besten Wert des Genauigkeitskriteriums verglichen werden.
Minitab erstellt für das neue Modell dieselben Tabellen und Diagramme wie für das ursprüngliche Modell. Die Tabellen und Grafiken für das neue Modell befinden sich in einem neuen Ergebnissatz. Die Notation ist dieselbe wie in der ursprünglichen Analyse. Die Speicherspalten befinden sich in demselben Arbeitsblatt. Wenn die ursprüngliche Analyse z. B. die angepasste Werte in einer Spalte mit dem Titel „Anpass“ gespeichert hat, betitelt die neue Analyse eine leere Spalte „Anpass_1“ und speichert die angepasste Werte.