Exemple de prédiction avec CART® Classification

Une équipe de chercheurs recueille et publie des informations détaillées sur les facteurs ayant une influence sur les maladies cardiaques. Les variables incluent l’âge, le sexe, les niveaux de cholestérol, la fréquence cardiaque maximale et plus encore. Cet exemple utilise un ensemble de données publiques comprenant des informations détaillées sur les maladies cardiaques. Les données d’origine proviennent du site archive.ics.uci.edu.

Dans l’exemple de la création d’arbre, les chercheurs souhaitent créer un arbre de classification qui identifie les prédicteurs importants pour indiquer si un patient souffre d’une maladie cardiaque. Les chercheurs veulent faire des prédictions à l’aide de cet arbre.

  1. Complet Exemple de création d’arbres avec CART® Classification.
  2. Cliquez sur le bouton Prévoir au bas des résultats de l’arbre de classification.
  3. Dans la liste déroulante, sélectionnez Entrez des valeurs individuelles.
  4. Saisissez les valeurs suivantes. Cet exemple utilise 2 valeurs pour chaque prédicteur. Il est important de choisir des valeurs qui se situent dans la plage des données d’origine. Cet exemple utilise 2 valeurs pour chaque prédicteur. La troisième colonne reste donc vide.
    Âge 35 35  
    Pression artérielle de repos 140 140  
    Cholestérol 233 233  
    Fréquence cardiaque maximale 150 165  
    Vieux pic 2,3 2,3  
    Sexe Mâle Femelle  
    Sucre de sang de jeûne Vrai Vrai  
    Exercice Angina * *  
    Repos ECG 0 1  
    Pente 1 3  
    Thal Normal Normal  
    Type de douleur thoracique 2 1  
    Principaux navires 0 2  
  5. Cliquez sur OK.

Interpréter les résultats

Minitab utilise l’arbre de classification dans les résultats pour estimer la probabilité de classe pour les 2 ensembles de valeurs de prédiction.
  • Pour le premier ensemble de valeurs de prédiction, les paramètres sont identiques aux paramètres du Nœud terminal 1. La prédiction de classe est Non. La probabilité de Non est de 0,91, et la probabilité de Oui est de 0,09.
  • Pour le deuxième ensemble de valeurs de prédiction, les paramètres sont identiques aux paramètres du Nœud terminal 4. La prédiction de classe est Oui. La probabilité de Oui est d’environ 0,74, et la probabilité de Non est d’environ 0,26.

CART® classification de 7 nœuds: Maladies cardiaques par rapport à Âge; Pression artérielle de repos; Cholestérol; Fréquence cardiaque maximale; Vieux pic; Sexe; Sucre de sang de jeûne; Exercice Angina; Repos ECG; Pente; Thal; Type de douleur thoracique; Principaux navires

Méthode Probabilités a priori Identique pour toutes les classes Division des nœuds Gini Arbre optimal Coût minimum de mauvais classement Validation de modèle Validation croisée pour 10 ensemble(s) Lignes utilisées 303

Prévision de CART® classification

Prévision pour Maladies cardiaques

Configuration

Âge = 35; Pression artérielle de repos = 140; Cholestérol = 233; Fréquence cardiaque maximale = 150; Vieux pic = 2,3; Sexe = Mâle; Sucre de sang de jeûne = Vrai; Exercice Angina = *; Repos ECG = 0; Pente = 1; Thal = Normal; Type de douleur thoracique = 2; Principaux navires = 0

Prévision Prob. Prob. ID du nœud (classe (classe Obs. terminal Classe = Oui) = Non) 1 1 Non 0,09 0,91

Prévision pour Maladies cardiaques

Configuration

Âge = 35; Pression artérielle de repos = 140; Cholestérol = 233; Fréquence cardiaque maximale = 165; Vieux pic = 2,3; Sexe = Femelle; Sucre de sang de jeûne = Vrai; Exercice Angina = *; Repos ECG = 1; Pente = 3; Thal = Normal; Type de douleur thoracique = 1; Principaux navires = 2

Prévision Prob. Prob. ID du nœud (classe (classe Obs. terminal Classe = Oui) = Non) 2 4 Oui 0,740741 0,259259
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique