Une équipe de chercheurs recueille et publie des informations détaillées sur les facteurs ayant une influence sur les maladies cardiaques. Les variables incluent l’âge, le sexe, les niveaux de cholestérol, la fréquence cardiaque maximale et plus encore. Cet exemple utilise un ensemble de données publiques comprenant des informations détaillées sur les maladies cardiaques. Les données d’origine proviennent du site archive.ics.uci.edu.
Les chercheurs souhaitent créer un arbre de classification qui identifie les prédicteurs importants pour indiquer si un patient souffre d’une maladie cardiaque.
Par défaut, Minitab affiche le plus petit arbre dont le coût de mauvais classement se situe à moins d’1 erreur type de l’arbre produisant le coût de mauvais classement le plus faible. Cet arbre comprend 4 nœuds terminaux.
Dans l’arborescence, les éléments bleus correspondent au niveau d’événement. Les éléments rouges correspondent au niveau du non-événement. Dans cette sortie, le niveau d’événement est "Oui" et indique que cette personne souffre d’une maladie cardiaque. Le niveau de non-événement est "Non" et indique que cette personne ne souffre pas de maladie cardiaque.
La division suivante pour le nœud enfant gauche et le nœud enfant droit est Type de douleur thoracique, avec une douleur évaluée sur une échelle allant de 1 à 4.
Explorez d'autres nœuds pour déterminer quelles variables sont les plus intéressantes. Les nœuds qui sont majoritairement bleus indiquent une forte proportion du niveau d’événement. Les nœuds qui sont majoritairement rouges indiquent une forte proportion du niveau de non-événement.