Anpassungen und Fehlerstatistiken für den besten und schlechtesten Endknoten für CART® Regression

Verwenden Sie die Anpassungen und Fehlerstatistiken, um Knoten von Interesse anhand ihrer Leistung zu charakterisieren.

Interpretation

In jeder Zeile der Tabelle werden die Anpassung und die Fehlerstatistiken für einen Knoten angezeigt. Die besten Knoten sind aufsteigend vom kleinsten Fehler bis zum größten Fehler angeordnet. Die schlechtesten Knoten sind absteigend vom größten Fehler bis zum kleinsten Fehler angeordnet.

Bei der Verwendung eines Testdatensatzes berechnet Minitab separate Statistiken für die Trainings- und die Testdaten. Sie können die Statistiken vergleichen, um die relative Leistung des Baums für die Trainingsdaten und neue Daten zu untersuchen. Die Teststatistiken sind in der Regel ein besseres Maß für die Leistung des Baums in Bezug auf neue Daten.

Anpassung
Die Anpassung ist der Mittelwert der Antwortvariablen für die Fälle im Knoten. Die Anpassung ist der prognostizierte Wert für neue Daten, die in denselben Knoten fallen. Endknoten mit Anpassungen, die sich von den anderen Endknoten unterscheiden, können von besonderem Interesse sein, da die angepassten Werte für Fälle in diesen Endknoten abweichen.
Anzahl
Die Anzahl gibt die Anzahl der Fälle im Knoten an. Wenn die Analyse Gewichtungen enthält, ist die Anzahl die gewichtete Anzahl. Endknoten mit vielen Fällen können von besonderem Interesse sein, da diese Knoten in der Regel gängigere Fälle darstellen.
StdAbw
Die Standardabweichung ist die Standardabweichung der Werte der Antwortvariablen im Knoten. Endknoten mit kleineren Standardabweichungen können von besonderem Interesse sein, da die Prognosen auf der Grundlage dieser Knoten genauer sind als bei Endknoten mit größeren Standardabweichungen.
MSE
Der mittlere quadrierte Fehler (MSE) ist ein Maß für die Genauigkeit des Knotens. Ausreißer haben eine größere Auswirkung auf den MSE als auf die MAD und den MAPE.
MAD

Die mittlere absolute Abweichung (MAD) drückt die Genauigkeit in der gleichen Einheit wie die Daten aus, wodurch der Fehlerbetrag leichter erfasst werden kann. Ausreißer haben eine geringere Auswirkung auf die MAD als auf den MSE.

MAPE
Der mittlere absolute prozentuale Fehler (MAPE) drückt die Genauigkeit als Prozentsatz des Fehlers aus. Da es sich bei dem MAPE um einen Prozentsatz handelt, ist dieser Wert möglicherweise verständlicher als die anderen Genauigkeitsmaße. Wenn der MAPE beispielsweise 5 beträgt, weicht die Prognose im Durchschnitt um 5 % ab. Ausreißer haben eine geringere Auswirkung auf den MAPE als auf den MSE.

In einigen Fällen kann jedoch ein sehr großer MAPE auftreten, obwohl der Knoten gut für die Daten passend zu sein scheint. Untersuchen Sie das Diagramm der angepassten vs. tatsächlichen Werte der Antwortvariablen auf Datenwerte, die nahe 0 liegen. Da beim MAPE der absolute Fehler durch die tatsächlichen Daten dividiert wird, können Werte, die nah bei 0 liegen, den MAPE stark ansteigen lassen.