Angeben der A-priori-Wahrscheinlichkeiten und Fehlklassifikationskosten für CART® Klassifikation

Predictive Analytics-Modul > CART® Klassifikation > A-priori/Kosten

A-priori-Wahrscheinlichkeiten für Antwortstufen

Die A-priori-Wahrscheinlichkeit ist die Wahrscheinlichkeit, dass eine Beobachtung einer Gruppe angehört, bevor die Daten erfasst werden. Wenn Sie keine A-priori-Wahrscheinlichkeiten angeben, geht Minitab davon aus, dass die Gruppen gleichermaßen wahrscheinlich sind.
  • Alle Stufen weisen die gleiche Wahrscheinlichkeit auf: In der Standardeinstellung werden gleiche A-priori-Wahrscheinlichkeiten für alle Stufen der Antwortvariablen verwendet. Wenn die Antwortvariable beispielsweise vier Stufen aufweist, wird jede Stufe auf 0,25 festgelegt.
  • Entsprechen den Gesamt-Stichprobenhäufigkeiten: Legen Sie die A-priori-Wahrscheinlichkeiten entsprechend den Stichprobenanteilen fest. Wenn z. B. die Gesamtzahl der Beobachtungen 1000 beträgt und festgelegt ist, dass 250 gleich Stufe 1, 475 gleich Stufe 2, 100 gleich Stufe 3 und 175 gleich Stufe 4 ist, verwendet Minitab die Anteile 0,25; 0,475; 0,10 und 0,175 für die Stufen.
  • Für jede Stufe eine A-priori-Wahrscheinlichkeit angeben: Legen Sie A-priori-Wahrscheinlichkeiten für jede Stufe fest. Jeder Wert muss zwischen 0 und 1 liegen. Die Summe der Wahrscheinlichkeiten für alle Stufen muss 1 betragen.

Fehlklassifikationskosten

Geben Sie die Kosten für Fehlklassifikation an. Standardmäßig verwendet Minitab gleiche Kosten von 1. Geben Sie größere Werte an, um höhere Kosten anzuzeigen. Die Kosten müssen größer als 0 sein.

Die folgende Tabelle zeigt beispielsweise, dass die Kosten der Fehlklassifikation eines potenziellen Kunden zehnmal höher sind als die der Fehlklassifikation eines uninteressierten Kunden. Das Verhältnis der Kosten ist relevant, nicht die tatsächlichen Kosten.

Prognostizierte Stufe
Tatsächliche Stufe Ja (Ereignis) Nein
Ja (Ereignis)   10
Nein 1