Indiquer les probabilités a priori pour et les coûts de classification erronée pour Classification CART®

Stat > Analyse prédictive > Classification CART® > A priori/coût

Probabilités a priori pour les niveaux de réponse

Une probabilités a priori pour est la probabilité qu’une observation soit classée dans un groupe avant de collecter les données. Lorsque vous ne spécifiez pas de probabilités a priori pour, Minitab suppose que les groupes présentent la même probabilité.
  • Tous les niveaux ont une probabilité égale: les probabilités a priori pour égales sont utilisées par défaut pour tous les niveaux de réponse. Par exemple, si la réponse comporte quatre niveaux, chaque niveau est défini sur 0,25.
  • Les probabilités correspondent au total des fréquences d'échantillonnage: définissez les probabilités a priori pour en fonction des proportions de l’échantillon. Par exemple, si le nombre total d’observations est de 1 000, parmi lesquelles 250 sont de niveau 1, 475 de niveau 2, 100 de niveau 3, et 175 de niveau 4, alors Minitab utilise les proportions de 0,25, 0,475, 0,10, et 0,175 pour les niveaux.
  • Spécifier une probabilité a priori pour chaque niveau: définissez les probabilités a priori pour chaque niveau. Chaque valeur doit être comprise entre 0 et 1. La somme des probabilités pour tous les niveaux doit être égale à 1.

Coûts de mauvais classement

Précisez les coûts de classification erronée. Par défaut, Minitab utilise des coûts égaux de 1. Pour indiquer des coûts plus élevés, utilisez des valeurs plus grandes. Les coûts doivent être supérieurs à 0.

Par exemple, le tableau suivant indique que le coût de mauvais classement d’un client potentiel est 10 fois supérieur à celui du mauvais classement d’un client non intéressé. Le rapport des coûts est pertinent, et non les coûts réels.

Niveau prévu
Niveau réel Oui (événement) Non
Oui (événement)   10
Non 1