Précisez les probabilités a priori et les coûts des erreurs de classification pour Classification CART®

Module d'analyse prédictive > Classification CART® > A priori/coût

Probabilités a priori pour les niveaux de réponse

Une probabilité a priori est la probabilité qu’une observation tombe dans un groupe avant que vous ne collectiez les données. Lorsque vous ne spécifiez pas de probabilités a priori, Minitab suppose que les groupes sont également probables.
  • Tous les niveaux ont une probabilité égale: La valeur par défaut utilise des probabilités a priori égales pour tous les niveaux de réponse. Par exemple, si la réponse comporte 4 niveaux, chaque niveau est défini sur 0,25.
  • Les probabilités correspondent au total des fréquences d'échantillonnage: Fixez des probabilités a priori en fonction des proportions de l’échantillon. Par exemple, si le nombre total d’observations est de 1000 et que 250 sont de niveau 1, 475 de niveau 2, 100 de niveau 3 et 175 de niveau 4, Minitab utilise les proportions de 0,25, 0,475, 0,10 et 0,175 pour les niveaux.
  • Spécifier une probabilité a priori pour chaque niveau: Fixez des probabilités préalables pour chaque niveau. Chaque valeur doit être comprise entre 0 et 1. La somme des probabilités pour tous les niveaux doit être égale à 1.

Coûts de mauvais classement

Spécifiez les coûts en cas d’erreur de classification. Par défaut, Minitab utilise des coûts égaux de 1. Pour indiquer des coûts plus élevés, utilisez des valeurs plus élevées. Les coûts doivent être supérieurs à 0.

Par exemple, le tableau suivant indique que le coût de la classification erronée d’un client potentiel est 10 fois plus élevé que celui d’une classification erronée d’un client non intéressé. C’est le rapport des coûts qui compte, et non les coûts réels.

Niveau prévu
Niveau réel Oui (Événement) Non
Oui (Événement)   10
Non 1