Angeben der A-priori-Wahrscheinlichkeiten und Fehlklassifikationskosten für CART® Klassifikation

Statistik > Prädiktive Analysen > CART® Klassifikation > A-priori/Kosten

A-priori-Wahrscheinlichkeiten für Antwortstufen

Eine A-priori-Wahrscheinlichkeit ist die vor der Datenerfassung vorliegende Wahrscheinlichkeit, dass eine Beobachtung in eine Gruppe fällt. Wenn Sie keine A-priori-Wahrscheinlichkeiten angeben, geht Minitab davon aus, dass die Gruppen gleichermaßen wahrscheinlich sind.
  • Alle Stufen weisen die gleiche Wahrscheinlichkeit auf: In der Standardeinstellung werden gleiche A-priori-Wahrscheinlichkeiten für alle Stufen der Antwortvariablen verwendet. Wenn die Antwortvariable beispielsweise vier Stufen aufweist, wird jede Stufe auf 0,25 festgelegt.
  • Entsprechen den Gesamt-Stichprobenhäufigkeiten: Legen Sie die A-priori-Wahrscheinlichkeiten entsprechend den Stichprobenanteilen fest. Wenn z. B. die Gesamtzahl der Beobachtungen 1000 beträgt und festgelegt ist, dass 250 gleich Stufe 1, 475 gleich Stufe 2, 100 gleich Stufe 3 und 175 gleich Stufe 4 ist, verwendet Minitab die Anteile 0,25; 0,475; 0,10 und 0,175 für die Stufen.
  • Für jede Stufe eine A-priori-Wahrscheinlichkeit angeben: Legen Sie A-priori-Wahrscheinlichkeiten für jede Stufe fest. Jeder Wert muss zwischen 0 und 1 liegen. Die Summe der Wahrscheinlichkeiten für alle Stufen muss 1 betragen.

Fehlklassifikationskosten

Geben Sie die Kosten für Fehlklassifikation an. Standardmäßig verwendet Minitab gleiche Kosten von 1. Geben Sie größere Werte an, um höhere Kosten anzuzeigen. Die Kosten müssen größer als 0 sein.

Die folgende Tabelle zeigt beispielsweise, dass die Kosten der Fehlklassifikation eines potenziellen Kunden zehnmal höher sind als die der Fehlklassifikation eines uninteressierten Kunden. Das Verhältnis der Kosten ist relevant, nicht die tatsächlichen Kosten.

Prognostizierte Stufe
Tatsächliche Stufe Ja (Ereignis) Nein
Ja (Ereignis)   10
Nein 1