Wählen Sie ein alternatives Modell aus

Führen Sie Predictive Analytics-Modul > Automatisiertes maschinelles Lernen > Bestes Modell ermitteln (binäre Antwort) aus. Klicken Sie auf die Schaltfläche Auswählen eines alternativen Modells nach der Tabelle mit der Modellauswahl.

Übersicht

Wenn Sie mit die unwichtigsten Prädiktoren entfernen, erstellt Minitab Statistical Software Ergebnisse für das Modell mit dem besten Wert des Genauigkeitskriteriums für die Analyse, z. B. der minimalen durchschnittlichen –Log-Likelihood. Mit Minitab können Sie Ergebnisse für andere Modelle und andere Modelltypen untersuchen. Wenn beispielsweise ein anderer Modelltyp eine ähnliche Vorhersagegenauigkeit erzeugt, können Sie bestimmen, ob dieselben Prädiktoren in jedem Modelltyp wichtig sind.

Die Element-ID hängt vom Typ der Anwendung ab. FürCART-® und binäre logistische Regressionsmodelle können Sie die Ergebnisse für das beste Modell aus der Suche untersuchen. Für Random Forests® und TreeNet® Modelle können Sie die Ergebnisse eines der Modelle in der Suche untersuchen. Für Random Forests® und TreeNet® Modelle können Sie auch die Hyperparameter optimieren, um nach Kombinationen zu suchen, die noch bessere Werte als die Hyperparameter in der Suche erzeugen.

Random Forests® Regression

Wählen Sie ein vorhandenes Modell aus, um Ergebnisse für eines der Modelle aus der Suche zu erhalten. Geben Sie Hyperparameter an, um neue Modelle anzupassen, um nach Kombinationen von Hyperparametern zu suchen, die die Leistung des Modells verbessern.

Vorhandenes Modell auswählen

Bei der Suche nach dem besten Modelltyp erzeugt die Analyse bis zu 3 Random Forests® Modelle mit unterschiedlichen Mindestgrößen für interne Knoten. Wählen Sie ein Modell aus der Liste aus, und klicken Sie Anzeigen der Ergebnisse auf , um Ergebnisse für dieses Modell zu erzeugen.

Hyperparameter zum Anpassen von neuen Modellen angeben

Für die Analyse müssen Sie die ersten 3 Hyperparameter angeben. Bootstrap-Stichprobenumfang kleiner als der Trainingsdatenumfang angeben Klicken Sie Anzeigen der Ergebnisse hier, um die Hyperparameter für die neuen Modelle auszuwerten. Die Ergebnisse enthalten eine Tabelle, die die Optimalitätskriterien für die verschiedenen Kombinationen von Hyperparametern und die Modellergebnisse für das Modell mit dem besten Wert des Optimalitätskriteriums vergleicht, z. B. dem minimalen Durchschnitt – loglikelihood.
Anzahl der Prädiktoren für die Knotenteilung
Geben Sie die Anzahl der Prädiktoren an, die für jede Knotenteilung berücksichtigt werden sollen. In der Regel funktioniert die Analyse gut, wenn Sie die Quadratwurzel der Gesamtzahl der Prädiktoren berücksichtigen. Einige Datensätze weisen jedoch Assoziationen unter den Prädiktoren auf, die zu einer besseren Leistung des Modells führen, wenn bei der Analyse für jeden Knoten eine größere oder kleinere Anzahl Prädiktoren berücksichtigt wird.
Minimale Anzahl der Fälle zum Teilen eines internen Knotens
Geben Sie die minimale Anzahl von Fällen ein, die ein Knoten aufweisen kann, wenn er immer noch in weitere Knoten geteilt werden kann. Standardmäßig enthält die ursprüngliche Suche die Zahlen 2, 5 und 8.
Anzahl der Bootstrap-Stichproben zum Aufbauen der Bäume
Geben Sie einen Wert ein, um die Anzahl der Bootstrap-Stichproben und die Anzahl der durch die Analyse erzeugten Bäume zu bestimmen. Geben Sie einen Wert zwischen 3 und 3000 ein.
Bootstrap-Stichprobenumfang kleiner als der Trainingsdatenumfang angeben
Wählen Sie diese Option aus, um einen Wert einzugeben, der den Umfang der Bootstrap-Stichprobe festlegt. Sie müssen einen Wert größer oder gleich 5 eingeben. Wenn Sie einen Umfang eingeben, der den Umfang des Trainingsdatensatzes übersteigt, verwendet Minitab einen Stichprobenumfang, die gleich dem Umfang des Trainingsdatensatzes ist.

TreeNet-®

Wählen Sie ein vorhandenes Modell aus, um Ergebnisse für eines der Modelle aus der Suche zu erhalten. Geben Sie Hyperparameter an, um neue Modelle anzupassen, um nach Kombinationen von Hyperparametern zu suchen, die die Leistung des Modells verbessern.

Vorhandenes Modell auswählen

Bei der Suche nach dem besten Modelltyp erzeugt die Analyse für jede Kombination von Hyperparametern ein TreeNet®Modell. Wählen Sie ein Modell aus der Liste aus, und klicken Sie Anzeigen der Ergebnisse auf , um Ergebnisse für dieses Modell zu erzeugen.

Hyperparameter zum Anpassen von neuen Modellen angeben

Für die Analyse müssen Sie alle Hyperparameter angeben. Klicken Sie Anzeigen der Ergebnisse hier, um die Hyperparameter für die neuen Modelle auszuwerten. Die Ergebnisse enthalten eine Tabelle, die die Optimalitätskriterien für die verschiedenen Kombinationen von Hyperparametern und die Ergebnisse für das Modell mit dem besten Wert des Genauigkeitskriteriums für die Analyse vergleicht, z. B. den minimalen Durchschnittswert – loglikelihood.

Trainingsrate
Geben Sie bis zu 10 Werte ein. Geeignete Werte liegen zwischen 0,0001 und 1.
Fraktion für Teilstichprobe
Geben Sie bis zu 10 Werte ein. Geeignete Werte sind größer als 0 und kleiner oder gleich 1.
Maximale Anzahl von Endknoten pro Baum und Maximale Baumtiefe
Wählen Sie, ob die Maximale Anzahl von Endknoten pro Baum oder die Maximale Baumtiefe ausgewertet werden sollen. Normalerweise ist jede der beiden Wahlmöglichkeiten eine sinnvolle Möglichkeit, ein brauchbares Modell zu identifizieren, und die Auswahl hängt allein von individuellen Präferenzen ab.
Maximale Anzahl von Endknoten
Geben Sie bis zu 3 Werte ein. Geeignete Werte liegen zwischen 2 und 2000. Bei einem Wert von 2 werden die Wechselwirkungen nicht untersucht.
Maximale Baumtiefe
Geben Sie bis zu 3 Werte ein. Geeignete Werte liegen zwischen 2 und 1000 ein, um die maximale Tiefe eines Baums darzustellen. Der Wurzelknoten entspricht einer Tiefe von 1. In vielen Anwendungen ergeben Tiefen von 4 bis 6 ausreichend gute Modelle.
Anzahl der Prädiktoren für die Knotenteilung
Geben Sie bis zu 3 Werte ein. Zulässige Werte liegen zwischen 1 und der Gesamtzahl der Prädiktoren. In der Regel funktioniert die Analyse gut, wenn Sie die Quadratwurzel der Gesamtzahl der Prädiktoren berücksichtigen. Einige Datensätze weisen jedoch Assoziationen unter den Prädiktoren auf, die zu einer besseren Leistung des Modells führen, wenn bei der Analyse für jeden Knoten eine größere oder kleinere Anzahl Prädiktoren berücksichtigt wird.
Anzahl der Bäume
Geben Sie einen Wert zwischen 1 und 5000 ein, um die maximale Anzahl der zu erstellenden Bäume anzugeben. Der Standardwert 300 liefert in der Regel nützliche Ergebnisse für die Auswertung der Hyperparameterwerte.
Wenn ein oder mehrere der als relevant erachteten Modelle über eine Anzahl von Bäumen verfügen, die in der Nähe der von Ihnen angegebenen Anzahl von Bäumen liegt, sollten Sie überlegen, ob Sie die Anzahl der Bäume erhöhen wollen. Wenn die Anzahl der Bäume näher an der maximalen Anzahl liegt, ist die Wahrscheinlichkeit größer, dass eine Erhöhung der Anzahl der Bäume die Leistung des Modells verbessert.

Logistische Regression

Wählen Sie Ergebnisse für Modell der logistischen Regression aus, und klicken Sie Anzeigen der Ergebnisse darauf, um die Ergebnisse für das beste binäre logistische Regressionsmodell aus der Suche nach dem besten Modelltyp zu erhalten.

CART®

Wählen Sie Ergebnisse für CART®-Modell aus, und klicken Sie Anzeigen der Ergebnisse darauf, um die Ergebnisse für das besteCART-® Modell aus der Suche nach dem besten Modelltyp zu erhalten.