Modellauswertung durch Eliminierung unwichtiger oder wichtiger Prädiktoren für Ermitteln von wichtigen Prädiktoren mit TreeNet® Regression

Hinweis

Dieser Befehl ist mit dem Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Hier finden Sie Definitionen und Anleitungen zur Interpretation für die Tabelle zur Modellauswertung.
Hinweis

Wenn Sie die Optionen für Wichtige Prädiktoren ermitteln angeben, können Sie Modellauswahlergebnisse sowohl für Trainings- als auch für Testdaten auswählen. Die Testergebnisse geben an, ob das Modell die Werte der Antwortvariablen für neue Beobachtungen angemessen prognostizieren oder die Beziehungen zwischen der Antwortvariablen und den Prädiktorvariablen adäquat zusammenfassen kann. Die Trainingsergebnisse sind in der Regel nur als Referenz gedacht.

Verwenden Sie die Ergebnisse, um die Modelle aus verschiedenen Schritten zu vergleichen. Um ein alternatives Modell aus der Tabelle weiter zu untersuchen, klicken Sie auf Alternatives Modell auswählen. Minitab erstellt einen vollständigen Satz von Ergebnissen für das alternative Modell. Sie können die Hyperparameter optimieren und entsprechende Prognosen erstellen.

Optimale Anzahl von Bäumen

Die optimale Anzahl von Bäumen unterscheidet sich in der Regel bei jedem Schritt. Wenn die optimale Anzahl nahe an der Gesamtzahl der Bäume für die Analyse liegt, wird das Modell mit größerer Wahrscheinlichkeit besser. Sie können überlegen, ob Sie ein alternatives Modell, das sich wahrscheinlich verbessern wird, weiter erforschen.

R-Quadrat (%)

R2 ist der Prozentsatz der Streuung in der Antwortvariablen, den das Modell erklärt. R2 kann Werte von 0 % bis 100 % annehmen.

Wenn Sie die „Quadrierter Fehler“-Verlustfunktion oder die Huber-Verlustfunktion verwenden, enthält die Tabelle den R2-Wert für jedes Modell. Die folgenden Ergebnisse beziehen sich auf das Modell mit dem höchsten R2-Wert. Wenn ein Modell mit einer geringeren Anzahl von Termen einen R2-Wert hat, der nahe am optimalen Wert liegt, dann sollten Sie überlegen, ob Sie das alternative Modell weiter untersuchen wollen. Ein Modell mit weniger Prädiktoren ist einfacher zu interpretieren und ermöglicht es Ihnen, mit einer geringeren Anzahl von Prädiktoren zu arbeiten.

MAD

Die mittlere absolute Abweichung (MAD) ist der Mittelwert des absoluten Wertes der Differenz zwischen einem prognostizierten Wert und einem tatsächlichen Wert. Je kleiner das MAD, desto besser ist das Modell an die Daten angepasst. Die MAD drückt die Genauigkeit in der gleichen Einheit wie die Daten aus, wodurch der Fehlerbetrag leichter erfasst werden kann.

Wenn Sie die Verlustfunktion „Absolute Abweichung“ verwenden, enthält die Tabelle den MAD-Wert für jedes Modell. Die vollständigen Ergebnisse, die auf die Tabelle folgen, beziehen sich auf das Modell mit dem geringsten MAD-Wert. Wenn ein Modell mit einer geringeren Anzahl von Termen einen MAD-Wert hat, der nahe am optimalen Wert liegt, dann sollten Sie überlegen, ob Sie das alternative Modell weiter untersuchen wollen. Ein Modell mit weniger Prädiktoren ist einfacher zu interpretieren und ermöglicht es Ihnen, mit einer geringeren Anzahl von Prädiktoren zu arbeiten.

Prädiktoranzahl

Die Prädiktoranzahl gibt die Anzahl der Prädiktoren im Modell an. Die Anzahl der Prädiktoren in der ersten Zeile der Tabelle entspricht immer allen Prädiktoren, die in der Analyse berücksichtigt werden. Nach der ersten Zeile hängt die Anzahl der Prädiktoren davon ab, ob die Analyse unwichtige Prädiktoren oder wichtige Prädiktoren eliminiert.

Wenn die Analyse die am wenigsten wichtigen Prädiktoren entfernt, verringert sich die Anzahl der Prädiktoren in jedem Schritt um eine bestimmte Anzahl von Prädiktoren sowie um alle Prädiktoren mit einer Wichtigkeitsbewertung von 0. Wenn die Analyse beispielsweise 10 Prädiktoren pro Schritt eliminiert, 900 Prädiktoren und 450 Prädiktoren mit Wichtigkeitswerten von 0 im ursprünglichen Modell enthält, hat die erste Zeile der Tabelle 900 Prädiktoren. Die zweite Zeile enthält 440 Prädiktoren, weil bei der Analyse die 450 Prädiktoren mit den Wichtigkeitswerten von 0 und die 10 am wenigsten wichtigen Prädiktoren entfernt werden.

Wenn die Analyse die wichtigsten Prädiktoren entfernt, verringert sich die Anzahl der Prädiktoren bei jedem Schritt um die angegebene Anzahl von Prädiktoren. Prädiktoren mit 0 Wichtigkeit verbleiben im Modell.

Eliminierte Prädiktoren

Die Spalte zeigt die eliminierten Prädiktoren bei den einzelnen Schritten. Die Liste zeigt höchstens 25 Prädiktortitel pro Schritt. In der ersten Zeile wird immer „Keine“ angezeigt, da das Modell über alle Prädiktoren verfügt. Nach der ersten Zeile hängt die Anzahl der Prädiktoren davon ab, ob die Analyse unwichtige Prädiktoren oder wichtige Prädiktoren eliminiert.

Wenn die Analyse die am wenigsten wichtigen Prädiktoren entfernt, verringert sich die Anzahl der Prädiktoren in jedem Schritt um eine bestimmte Anzahl von Prädiktoren sowie um alle Prädiktoren mit 0 Wichtigkeitswerten. Wenn die Analyse Prädiktoren mit 0 Wichtigkeitswerten eliminiert, stehen diese Prädiktoren an erster Stelle in der Liste. Wenn die Analyse mehr als einen Prädiktor in beiden Kategorien eliminiert, entspricht die Reihenfolge der Namen der Reihenfolge der Prädiktoren aus dem Arbeitsblatt.

Wenn die Analyse die wichtigsten Prädiktoren entfernt, zeigt die Liste die eliminierten Prädiktoren aus jedem Schritt an. Wenn die Analyse mehr als einen wichtigen Prädiktor in einem Schritt eliminiert, entspricht die Reihenfolge der Namen in der Liste der Reihenfolge der Prädiktoren aus dem Arbeitsblatt.