Modellauswertung durch Eliminierung unwichtiger oder wichtiger Prädiktoren für Ermitteln von wichtigen Prädiktoren mit TreeNet®-Klassifikation

Hier finden Sie Definitionen und Anleitungen zur Interpretation für die Tabelle zur Modellauswertung.
Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Hinweis

Wenn Sie die Optionen für Wichtige Prädiktoren ermitteln angeben, können Sie Modellauswahlergebnisse sowohl für Trainings- als auch für Testdaten auswählen. Die Testergebnisse geben an, ob das Modell die Werte der Antwortvariablen für neue Beobachtungen angemessen prognostizieren oder die Beziehungen zwischen der Antwortvariablen und den Prädiktorvariablen adäquat zusammenfassen kann. Die Trainingsergebnisse sind in der Regel nur als Referenz gedacht.

Verwenden Sie die Ergebnisse, um die Modelle aus verschiedenen Schritten zu vergleichen. Um ein alternatives Modell aus der Tabelle weiter zu untersuchen, klicken Sie auf Auswählen eines alternativen Modells. Minitab erstellt einen vollständigen Satz von Ergebnissen für das alternative Modell. Sie können die Hyperparameter optimieren und entsprechende Prognosen erstellen.

Optimale Anzahl von Bäumen

Die optimale Anzahl von Bäumen unterscheidet sich in der Regel bei jedem Schritt. Wenn die optimale Anzahl nahe an der Gesamtzahl der Bäume für die Analyse liegt, wird das Modell mit größerer Wahrscheinlichkeit besser. Sie können überlegen, ob Sie ein alternatives Modell, das sich wahrscheinlich verbessern wird, weiter erforschen.

Durchschnittliche –Log-Likelihood

Die durchschnittliche –Log-Likelihood ist ein Maß für die Modellgenauigkeit. Kleinere Werte weisen auf eine bessere Anpassung hin.

Wenn die Antwort binär ist, können Sie die maximale Log-Likelihood als Kriterium für die Auswahl des besten Modells verwenden. Die vollständigen Ergebnisse, die auf die Tabelle folgen, gelten für das Modell mit dem geringsten Wert der durchschnittlichen –Log-Likelihood. Wenn ein Modell mit einer geringeren Anzahl von Termen eine durchschnittliche –Log-Likelihood hat, die nahe am optimalen Wert liegt, dann sollten Sie überlegen, ob Sie das alternative Modell weiter untersuchen sollten. Ein Modell mit weniger Prädiktoren ist einfacher zu interpretieren und ermöglicht es Ihnen, mit einer geringeren Anzahl von Prädiktoren zu arbeiten.

Fläche unterhalb der ROC-Kurve

Die ROC-Kurve zeigt die Richtig-Positiv-Rate (TPR), auch als Trennschärfe bezeichnet, auf der y-Achse. Die ROC-Kurve zeigt die Falsch-Positiv-Rate (FPR), auch als Fehler 1. Art bezeichnet, auf der x-Achse. Die Fläche unter einer ROC-Kurve gibt an, ob das Modell ein guter Klassifikator ist.

Bei Klassifikationsbäumen nimmt die Fläche unter der ROC-Kurve in der Regel Werte von 0,5 bis 1 an. Je größer die Werte, desto besser ist das Klassifikationsmodell. Wenn das Modell die Klassen perfekt trennen kann, entspricht die Fläche unter der Kurve 1. Wenn das Modell die Klassen nicht besser als eine zufällige Einteilung trennen kann, entspricht die Fläche unter der Kurve 0,5.

Wenn Sie die maximale Fläche unter der ROC-Kurve als Kriterium für die Auswahl des besten Modells verwenden, enthält die Tabelle den Bereich unter der ROC-Kurve für jedes Modell. Die vollständigen Ergebnisse, die der Tabelle folgen, gelten für das Modell mit der größten Fläche unter der ROC-Kurve. Wenn ein Modell mit einer geringeren Anzahl von Termen einen Wert hat, der nahe am optimalen Wert liegt, dann sollten Sie überlegen, ob Sie das alternative Modell weiter untersuchen wollen. Ein Modell mit weniger Prädiktoren ist einfacher zu interpretieren und ermöglicht es Ihnen, mit einer geringeren Anzahl von Prädiktoren zu arbeiten.

Fehlklassifizierungsrate

Die Fehlklassifizierungsrate gibt an, wie oft das Modell die Antwortwerte richtig klassifiziert. Kleinere Werte weisen auf eine bessere Leistung hin.

Wenn Sie die minimale Fehlklassifizierungsrate als Kriterium für die Auswahl des besten Modells verwenden, enthält die Tabelle die Fehlklassifizierungsrate für jedes Modell. Die vollständigen Ergebnisse, die auf die Tabelle folgen, gelten für das Modell mit der geringsten Fehlklassifizierungsrate. Wenn ein Modell mit einer geringeren Anzahl von Termen einen Wert hat, der nahe am optimalen Wert liegt, dann sollten Sie überlegen, ob Sie das alternative Modell weiter untersuchen wollen. Ein Modell mit weniger Prädiktoren ist einfacher zu interpretieren und ermöglicht es Ihnen, mit einer geringeren Anzahl von Prädiktoren zu arbeiten.

Prädiktoranzahl

Die Prädiktoranzahl gibt die Anzahl der Prädiktoren im Modell an. Die Anzahl der Prädiktoren in der ersten Zeile der Tabelle entspricht immer allen Prädiktoren, die in der Analyse berücksichtigt werden. Nach der ersten Zeile hängt die Anzahl der Prädiktoren davon ab, ob die Analyse unwichtige Prädiktoren oder wichtige Prädiktoren eliminiert.

Wenn die Analyse die am wenigsten wichtigen Prädiktoren entfernt, verringert sich die Anzahl der Prädiktoren in jedem Schritt um eine bestimmte Anzahl von Prädiktoren sowie um alle Prädiktoren mit einer Wichtigkeitsbewertung von 0. Wenn die Analyse beispielsweise 10 Prädiktoren pro Schritt eliminiert, 900 Prädiktoren und 450 Prädiktoren mit Wichtigkeitswerten von 0 im ursprünglichen Modell enthält, hat die erste Zeile der Tabelle 900 Prädiktoren. Die zweite Zeile enthält 440 Prädiktoren, weil bei der Analyse die 450 Prädiktoren mit den Wichtigkeitswerten von 0 und die 10 am wenigsten wichtigen Prädiktoren entfernt werden.

Wenn die Analyse die wichtigsten Prädiktoren entfernt, verringert sich die Anzahl der Prädiktoren bei jedem Schritt um die angegebene Anzahl von Prädiktoren. Prädiktoren mit 0 Wichtigkeit verbleiben im Modell.

Eliminierte Prädiktoren

Die Spalte zeigt die eliminierten Prädiktoren bei den einzelnen Schritten. Die Liste zeigt höchstens 25 Prädiktortitel pro Schritt. In der ersten Zeile wird immer „Keine“ angezeigt, da das Modell über alle Prädiktoren verfügt. Nach der ersten Zeile hängt die Anzahl der Prädiktoren davon ab, ob die Analyse unwichtige Prädiktoren oder wichtige Prädiktoren eliminiert.

Wenn die Analyse die am wenigsten wichtigen Prädiktoren entfernt, verringert sich die Anzahl der Prädiktoren in jedem Schritt um eine bestimmte Anzahl von Prädiktoren sowie um alle Prädiktoren mit 0 Wichtigkeitswerten. Wenn die Analyse Prädiktoren mit 0 Wichtigkeitswerten eliminiert, stehen diese Prädiktoren an erster Stelle in der Liste. Wenn die Analyse mehr als einen Prädiktor in beiden Kategorien eliminiert, entspricht die Reihenfolge der Namen der Reihenfolge der Prädiktoren aus dem Arbeitsblatt.

Wenn die Analyse die wichtigsten Prädiktoren entfernt, zeigt die Liste die eliminierten Prädiktoren aus jedem Schritt an. Wenn die Analyse mehr als einen wichtigen Prädiktor in einem Schritt eliminiert, entspricht die Reihenfolge der Namen in der Liste der Reihenfolge der Prädiktoren aus dem Arbeitsblatt.