Methoden und Formeln für Fehlklassifikation in CART® Klassifizierung

Wählen Sie die gewünschte Methode oder Formel aus.

Die Fehlklassifikationstabelle ist nicht vorhanden, wenn als Teilungsmethode die Klassenwahrscheinlichkeit verwendet wird.

Anzahl und Anzahl gewichtet

Wenn keine Gewichtungen verwendet werden, sind die Anzahlen und die Stichprobenumfänge gleich.

Sind Gewichtungen vorhanden, entspricht die Anzahl gewichtet der Summe der Gewichtungen für eine Kategorie. Wenn Sie über Gewichtungen verfügen, berechnen Sie die verschiedenen Gewichtungen mit den Anzahlen gewichtet.

% Fehler

Verwenden Sie im Fall mit Gewichtungen die Anzahlen gewichtet anstelle von Anzahlen.

Kosten

Die Berechnung der Kosten hängt davon ab, ob die Antwortvariable binär oder multinomial ist.

Kosten = (% Fehler - eingegebene Fehlklassifikationskosten für Klasse) / 100

Binäre Antwortvariable

Die folgende Gleichung gibt die Kosten für die Ereignisklasse an:

Die folgende Gleichung gibt die Kosten für die Nicht-Ereignisklasse an:

Die folgende Gleichung gibt die Gesamtkosten für alle Klassen an:

Multinomiale Antwortvariable

Für den multinomialen Fall erweitert die Gleichung die Formel für die binäre Antwortvariable, sodass alle möglichen Formen der Fehlklassifikation berücksichtigt werden. Für eine multinomiale Antwortvariable mit k Klassen gilt beispielsweise für die Fehlklassifikationskosten für Y = 1 die folgende Gleichung:

Die folgende Gleichung gibt die Gesamtkosten für den multinomialen Fall an:

Betrachten Sie beispielsweise eine Antwortvariable mit drei Klassen und den folgenden Fehlklassifikationskosten:

Prognostizierte Klasse
Tatsächliche Klasse 1 2 3
1 0,0 4,1 3,2
2 5,6 0,0 1,1
3 0,4 0,9 0,0

Berücksichtigen Sie dann die In der folgenden Tabelle angegebenen prozentualen Fehler:

Prognostizierte Klasse
Tatsächliche Klasse 1 2 3
1 Nicht zutreffend 1 % 0,5 %
2 1,4 % Nicht zutreffend 2,1 %
3 5 % 1,2 % Nicht zutreffend

Berücksichtigen Sie schließlich, dass die Klassen der Antwortvariablen die folgenden A-priori-Wahrscheinlichkeiten aufweisen:

Die folgenden Gleichungen geben die Kosten an, die mit der Fehlklassifikation für jede Klasse in der Antwortvariablen verbunden sind:

Die folgende Gleichung gibt die Gesamtkosten an:

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien