Exemple de prédiction avec Classification CART®

Une équipe de chercheurs recueille et publie des informations détaillées sur les facteurs ayant une influence sur les maladies cardiaques. Les variables incluent l’âge, le sexe, les niveaux de cholestérol, la fréquence cardiaque maximale et plus encore. Cet exemple utilise un ensemble de données publiques comprenant des informations détaillées sur les maladies cardiaques. Les données d’origine proviennent du site archive.ics.uci.edu.

Dans l’exemple de la création d’arbre, les chercheurs souhaitent créer un arbre de classification qui identifie les prédicteurs importants pour indiquer si un patient souffre d’une maladie cardiaque. Les chercheurs veulent faire des prédictions à l’aide de cet arbre.

  1. Complet Exemple de Classification CART®.
  2. Cliquez sur le bouton Prévoir au bas des résultats de l’arbre de classification.
  3. Dans la liste déroulante, sélectionnez Entrer des valeurs individuelles.
  4. Saisissez les valeurs suivantes. Cet exemple utilise 2 valeurs pour chaque prédicteur. Il est important de choisir des valeurs qui se situent dans la plage des données d’origine. Cet exemple utilise 2 valeurs pour chaque prédicteur. La troisième colonne reste donc vide.
    Âge 35 35  
    Pression artérielle de repos 140 140  
    Cholestérol 233 233  
    Fréquence cardiaque maximale 150 165  
    Vieux pic 2,3 2,3  
    Sexe Mâle Femelle  
    Type de douleur thoracique 2 1  
    Sucre de sang de jeûne Vrai Vrai  
    Repos ECG 0 1  
    Exercice Angina      
    Pente 1 3  
    Principaux navires 0 2  
    Thal Normal Normal  
  5. Cliquez sur OK.

Interpréter les résultats

Minitab utilise l’arbre de classification dans les résultats pour estimer la probabilité de classe pour les 2 ensembles de valeurs de prédiction.
  • Pour le premier ensemble de valeurs de prédiction, les paramètres sont identiques aux paramètres du Nœud terminal 1. La prédiction de classe est Non. La probabilité de Non est de 0,91, et la probabilité de Oui est de 0,09.
  • Pour le deuxième ensemble de valeurs de prédiction, les paramètres sont identiques aux paramètres du Nœud terminal 4. La prédiction de classe est Oui. La probabilité de Oui est d’environ 0,74, et la probabilité de Non est d’environ 0,26.

Classification CART® de 7 nœuds: Maladies cardiaques vs Âge; Pression artérielle de repos; Cholestérol; Fréquence cardiaque maximale; Vieux pic; Sexe; Sucre de sang de jeûne; Exercice Angina; Repos ECG; Pente; Thal; Type de douleur thoracique; Principaux navires

Méthode Probabilités a priori Identique pour toutes les classes Division des nœuds Gini Arbre optimal Coût minimum de mauvais classement Validation de modèle Validation croisée pour 10 ensemble(s) Lignes utilisées 303

Prévision de classification CART®

Prévision pour Maladies cardiaques

Configuration Âge = 35; Pression artérielle de repos = 140; Cholestérol = 233; Fréquence cardiaque maximale = 150; Vieux pic = 2,3; Sexe = Mâle; Type de douleur thoracique = 2; Sucre de sang de jeûne = Vrai; Repos ECG = 0; Exercice Angina = ""; Pente = 1; Principaux navires = 0; Thal = Normal
Prévision Prob. Prob. ID du nœud (classe (classe Obs. terminal Classe = Oui) = Non) 1 1 Non 0,09 0,91

Prévision pour Maladies cardiaques

Configuration Âge = 35; Pression artérielle de repos = 140; Cholestérol = 233; Fréquence cardiaque maximale = 165; Vieux pic = 2,3; Sexe = Femelle; Type de douleur thoracique = 1; Sucre de sang de jeûne = Vrai; Repos ECG = 1; Exercice Angina = ""; Pente = 3; Principaux navires = 2; Thal = Normal
Prévision Prob. Prob. ID du nœud (classe (classe Obs. terminal Classe = Oui) = Non) 2 4 Oui 0,740741 0,259259