Une équipe de chercheurs recueille et publie des informations détaillées sur les facteurs ayant une influence sur les maladies cardiaques. Les variables incluent l’âge, le sexe, les niveaux de cholestérol, la fréquence cardiaque maximale et plus encore. Cet exemple utilise un ensemble de données publiques comprenant des informations détaillées sur les maladies cardiaques. Les données d’origine proviennent du site archive.ics.uci.edu.
Les chercheurs souhaitent créer un arbre de classification qui identifie les prédicteurs importants pour indiquer si un patient souffre d’une maladie cardiaque.
Sélectionnez Stat > Analyse
prédictive > Classification CART®.
Dans la liste déroulante, sélectionnez Réponse
binaire.
Dans Réponse, saisissez Maladies cardiaques.
Dans Evénement de
réponse, sélectionnez Oui pour indiquer qu'une maladie cardiaque a été détectée chez le patient.
Dans Prédicteurs continus, saisissez Âge, Pression artérielle de repos, Cholestérol, Fréquence cardiaque maximale et Vieux pic.
Dans Prédicteurs de catégorie, saisissez Sexe, Type de douleur thoracique, Sucre de sang de jeûne, Repos ECG, Exercice Angina, Pente, Principaux navires et Thal.
Cliquez sur OK.
Interpréter des résultats
Par défaut, Minitab affiche le plus petit arbre dont le coût de mauvais classement se situe à moins d’1 erreur type de l’arbre produisant le coût de mauvais classement le plus faible. Cet arbre comprend 4 nœuds terminaux.
Avant d’examiner l’arbre, les chercheurs consultent le diagramme détaillant le coût de mauvais classement déterminé par la validation croisée et le nombre de nœuds terminaux. Dans ce diagramme, le modèle dans lequel le coût de mauvais classement diminue se poursuit après l’arbre à 4 nœuds. Dans un cas comme celui-ci, les analystes choisissent d'étudier certains des autres arbres simples avec des coûts de mauvais classement plus faibles.
Sélectionner un arbre alternatif
Dans la sortie, cliquez sur Sélectionner un arbre alternatif.
Dans le diagramme, sélectionnez l’arbre à 7 nœuds avec le coût de mauvais classement le plus faible et la meilleure valeur ROC.
Cliquez sur Créer un
arbre.
Interpréter des résultats
Dans l’arborescence, les éléments bleus correspondent au niveau d’événement. Les éléments rouges correspondent au niveau du non-événement. Dans cette sortie, le niveau d’événement est "Oui" et indique que cette personne souffre d’une maladie cardiaque. Le niveau de non-événement est "Non" et indique que cette personne ne souffre pas de maladie cardiaque.
Au nœud racine, 139 événements Oui et 164 événements Non ont été dénombrés. Le nœud racine est divisé à l’aide de la variable THAL. Lorsque THAL = Normal, allez au nœud gauche (Nœud 2). Lorsque THAL = Fixe ou Réversible, allez au nœud droit (Nœud 5).
Nœud 2 : la variable THAL avait la valeur Normal 167 fois. Sur les 167 cas, 38 ou 22,8 % sont oui et 129 ou 77,2 % sont non.
Nœud 5 : la variable THAL avait la valeur sur Fixe ou Réversible 136 fois. Sur les 136 cas, 101 ou 74,3% sont oui et 35 ou 25,7% sont non.
La division suivante pour le nœud enfant gauche et le nœud enfant droit est Type de douleur thoracique, avec une douleur évaluée sur une échelle allant de 1 à 4.
Explorez d'autres nœuds pour déterminer quelles variables sont les plus intéressantes. Les nœuds qui sont majoritairement bleus indiquent une forte proportion du niveau d’événement. Les nœuds qui sont majoritairement rouges indiquent une forte proportion du niveau de non-événement.
Classification CART® de 7 nœuds: Maladies cardiaques vs Âge; Pression artérielle de repos; Cholestérol; Fréquence cardiaque maximale; Vieux pic; Sexe; Sucre de sang de jeûne; Exercice Angina; Repos ECG; Pente; Thal; Type de douleur thoracique; Principaux navires