Methoden und Formeln für Fehlklassifikation in CART® Klassifikation

Wählen Sie die gewünschte Methode oder Formel aus.

Die Fehlklassifikationstabelle ist nicht vorhanden, wenn als Teilungsmethode die Klassenwahrscheinlichkeit verwendet wird.

Anzahl

Wenn keine Gewichtungen vorhanden sind, sind die Anzahlen und die Stichprobenumfänge gleich.

Anzahl gewichtet

Sind Gewichtungen vorhanden, entspricht die Anzahl gewichtet der Summe der Gewichtungen für eine Kategorie. Gewichte Anzahlen werden auf die nächste ganze Zahl gerundet. Verwenden Sie die nicht gerundeten Gewichtungen zur Berechnung von Prozentsätzen und Raten. Betrachten Sie das folgende einfache Beispiel:
Antwortebene Prognostizierte Stufe Gewichtung
Ja Ja 0,1
Ja Ja 0,2
Ja Nein 0,3
Ja Nein 0,4
Nein Nein 0,5
Nein Nein 0,6
Nein Ja 0,7
Nein Ja 0,8
Diese Tabelle enthält die folgenden Statistiken:
Tatsächliche Klasse Anzahl gewichtet Fehlklassifiziert Prognostizierte Klasse = Nein Prozent richtig
Ja 0,1 + 0,2 + 0,3 + 0,4 = 1 0,1 + 0,2 = 0,3 ≈ 0 0,3 + 0,4 = 0,7 ≈ 1 (0,3 / 1,0) × 100 = 30 %
Nein 0,5 + 0,6 + 0,7 + 0,8 = 2,6 ≈ 3 0,7 + 0,8 = 1,5 ≈ 2 0,5 + 0,6 = 1,1 ≈ 1 1,1 / 2,6 × 100 = 42,31 %
Alle 1 + 2,6 = 3,6 ≈ 4 0,3 + 1,5 = 1,8 ≈ 2 0,7 + 1,1 = 1,8 ≈ 2 (0,3 + 1,1) / 3,6 × 100 = 38,89 %

% Fehler

Verwenden Sie im Fall mit Gewichtungen die Anzahlen gewichtet anstelle von Anzahlen.

Kosten

Die Berechnung der Kosten hängt davon ab, ob die Antwortvariable binär oder multinomial ist.

Kosten = (% Fehler - eingegebene Fehlklassifikationskosten für Klasse) / 100

Binäre Antwortvariable

Die folgende Gleichung gibt die Kosten für die Ereignisklasse an:

Die folgende Gleichung gibt die Kosten für die Nicht-Ereignisklasse an:

Die folgende Gleichung gibt die Gesamtkosten für alle Klassen an:

Multinomiale Antwortvariable

Für den multinomialen Fall erweitert die Gleichung die Formel für die binäre Antwortvariable, sodass alle möglichen Formen der Fehlklassifikation berücksichtigt werden. Bei einer multinomialen Antwort mit k Klassen wird beispielsweise für die Fehlklassifizierungskosten für Y = 1 die folgende Gleichung verwendet:

Die folgende Gleichung gibt die Gesamtkosten für den multinomialen Fall an:

Betrachten Sie beispielsweise eine Antwortvariable mit drei Klassen und den folgenden Fehlklassifikationskosten:

  Prognostizierte Klasse
Tatsächliche Klasse 1 2 3
1 0,0 4,1 3,2
2 5,6 0,0 1,1
3 0,4 0,9 0,0

Berücksichtigen Sie dann die In der folgenden Tabelle angegebenen prozentualen Fehler:

  Prognostizierte Klasse
Tatsächliche Klasse 1 2 3
1 Nicht zutreffend 1% 0,5 %
2 1,4 % Nicht zutreffend 2,1 %
3 5 % 1,2 % Nicht zutreffend

Berücksichtigen Sie schließlich, dass die Klassen der Antwortvariablen die folgenden A-priori-Wahrscheinlichkeiten aufweisen:

Die folgenden Gleichungen geben die Kosten an, die mit der Fehlklassifikation für jede Klasse in der Antwortvariablen verbunden sind:

Die folgende Gleichung gibt die Gesamtkosten an: