Une équipe de chercheurs recueille et publie des informations détaillées sur les facteurs qui affectent les maladies cardiaques. Les variables comprennent l’âge, le sexe, le taux de cholestérol, la fréquence cardiaque maximale, etc. Cet exemple est basé sur un ensemble de données publiques qui fournit des informations détaillées sur les maladies cardiaques. Les données originales proviennent de archive.ics.uci.edu.
Les chercheurs veulent créer un arbre de classification qui identifie les prédicteurs importants pour indiquer si un patient souffre d’une maladie cardiaque.
Dans la liste déroulante, sélectionnez Réponse
binaire.
Dans Réponse, entrez Maladies cardiaques.
Dans Evénement de
réponse, sélectionnez Oui pour indiquer qu’une maladie cardiaque a été identifiée chez le patient.
Dans Prédicteurs continus, entrez Âge, Pression artérielle de repos, Cholestérol, Fréquence cardiaque maximale et Vieux pic.
Dans Prédicteurs de catégorie, entrez Sexe, Type de douleur thoracique, Sucre de sang de jeûne, Repos ECG, Exercice Angina, Pente, Principaux navires, et Thal.
Cliquez sur OK.
Interpréter les résultats
Par défaut, Minitab affiche l’arborescence la plus petite avec un coût d’erreur de classification inférieur à 1 erreur standard de l’arbre qui minimise le coût d’erreur de classification. Cet arbre comporte 4 nœuds terminaux.
Avant d’examiner l’arbre, les chercheurs examinent le graphique qui montre le coût de l’erreur de classification à partir de la validation croisée et le nombre de nœuds terminaux. Dans ce graphique, le modèle où le coût de l’erreur de classification diminue se poursuit après l’arbre à 4 nœuds. Dans un cas comme celui-ci, les analystes choisissent d’explorer certains des autres arbres simples qui ont des coûts de classification erronée plus faibles.
Sélectionnez un autre arbre
Dans la sortie, cliquez sur Sélectionner un arbre alternatif
Dans le graphique, sélectionnez l’arborescence à 7 nœuds qui présente le coût d’erreur de classification le plus faible et la meilleure valeur ROC.
Cliquez sur Créer un
arbre.
Interpréter les résultats
Dans l’arborescence, les éléments bleus sont destinés au niveau de l’événement. Les éléments rouges sont destinés au niveau non-événement. Dans cette sortie, le niveau de l’événement est « Oui » et indique qu’une personne souffre d’une maladie cardiaque. Le niveau de non-événement est « Non » et indique qu’une personne n’a pas de maladie cardiaque.
Au niveau du nœud racine, il y a 139 comptes de l’événement Oui et 164 comptes de l’événement Non. Le nœud racine est divisé à l’aide de la variable THAL. Lorsque THAL = Normal, allez au nœud gauche (Nœud 2). Lorsque THAL = Fixe ou Réversible, allez au nœud de droite (Nœud 5).
Nœud 2 : Il y a 167 cas où THAL était normal. Sur les 167 cas, 38 (22,8 %) sont Oui et 129 (77,2 %) sont Non.
Nœud 5 : Il y a 136 cas où THAL était fixe ou réversible. Sur les 136 cas, 101 (74,3%) sont Oui et 35 (25,7%) sont Non.
Le séparateur suivant pour le nœud enfant gauche et le nœud enfant droit est le type de douleur thoracique, où la douleur est évaluée à 1, 2, 3 ou 4.
Explorez d’autres nœuds pour voir quelles variables sont les plus intéressantes. Les nœuds qui sont principalement bleus indiquent une forte proportion du niveau de l’événement. Les nœuds qui sont principalement rouges indiquent une forte proportion du niveau de non-événement.
Classification CART® de 7 nœuds: Maladies cardiaques vs Âge; Pression artérielle de repos; Cholestérol; Fréquence cardiaque maximale; Vieux pic; Sexe; Sucre de sang de jeûne; Exercice Angina; Repos ECG; Pente; Thal; Type de douleur thoracique; Principaux navires