Exemple de prédiction avec Classification CART®

Une équipe de chercheurs recueille et publie des informations détaillées sur les facteurs qui affectent les maladies cardiaques. Les variables comprennent l’âge, le sexe, le taux de cholestérol, la fréquence cardiaque maximale, etc. Cet exemple est basé sur un ensemble de données publiques qui fournit des informations détaillées sur les maladies cardiaques. Les données originales proviennent de archive.ics.uci.edu.

Dans l’exemple de la création d’un arbre, les chercheurs ont créé un arbre de classification qui identifie les prédicteurs importants pour indiquer si un patient souffre d’une maladie cardiaque. Les chercheurs veulent faire des prédictions avec cet arbre.

  1. Terminez le Exemple de Classification CART®.
  2. Cliquez sur le bouton Prédire en bas des résultats de l’arborescence de classification.
  3. Dans la liste déroulante, sélectionnez Entrer des valeurs individuelles.
  4. Entrez les valeurs suivantes. Cet exemple utilise 2 valeurs pour chaque prédicteur. Il est important de choisir des valeurs qui se trouvent dans la plage des données d’origine. Cet exemple utilise 2 valeurs pour chaque prédicteur, de sorte que la troisième colonne reste vide.
    Âge 35 35  
    Pression artérielle de repos 140 140  
    Cholestérol 233 233  
    Fréquence cardiaque maximale 150 165  
    Vieux pic 2,3 2,3  
    Sexe Mâle Femelle  
    Type de douleur thoracique 2 1  
    Sucre de sang de jeûne Vrai Vrai  
    Repos ECG 0 1  
    Exercice Angina      
    Pente 1 3  
    Principaux navires 0 2  
    Thal Normal Normal  
  5. Cliquez sur OK.

Interpréter les résultats

Minitab utilise l’arbre de classification dans les résultats pour estimer la probabilité de classe pour les 2 ensembles de valeurs de prédiction.
  • Pour le premier ensemble de valeurs de prédiction, les paramètres sont les mêmes que ceux du nœud terminal 1. La prédiction de classe est non. La probabilité pour Non est de 0,91 et la probabilité pour Oui est de 0,09.
  • Pour le deuxième ensemble de valeurs de prédiction, les paramètres sont les mêmes que ceux du nœud terminal 4. La prédiction de la classe est Oui. La probabilité pour Oui est d’environ 0,74 et la probabilité pour Non est d’environ 0,26.

Prévision pour Maladies cardiaques

Configuration

Âge = 35;Pression artérielle de repos = 140;Cholestérol = 233;
Fréquence cardiaque maximale = 150;Vieux pic = 2,3;Sexe = Mâle;
Type de douleur thoracique = 2;Sucre de sang de jeûne = Vrai;Repos ECG = 0;
Exercice Angina = "";Pente = 1;Principaux navires = 0;Thal = Normal

Prévision

Obs.ID du nœud
terminal
ClasseProb.
(classe
= Oui)
Prob.
(classe
= Non)
11Non0,090,91

Prévision pour Maladies cardiaques

Configuration

Âge = 35;Pression artérielle de repos = 140;Cholestérol = 233;
Fréquence cardiaque maximale = 165;Vieux pic = 2,3;Sexe = Femelle;
Type de douleur thoracique = 1;Sucre de sang de jeûne = Vrai;Repos ECG = 1;
Exercice Angina = "";Pente = 3;Principaux navires = 2;Thal = Normal

Prévision

Obs.ID du nœud
terminal
ClasseProb.
(classe
= Oui)
Prob.
(classe
= Non)
24Oui0,7407410,259259