Exemple de prévision avec la fonction Classification Random Forests®

Remarque

Cette commande est disponible avec le module complémentaire d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Une équipe de chercheurs recueille et publie des informations détaillées sur les facteurs ayant une influence sur les maladies cardiaques. Les variables incluent l’âge, le sexe, les niveaux de cholestérol, la fréquence cardiaque maximale et plus encore. Cet exemple utilise un ensemble de données publiques comprenant des informations détaillées sur les maladies cardiaques. Les données d’origine proviennent du site archive.ics.uci.edu.

Les chercheurs peuvent utiliser le modèle d'arbres Random Forests® Classification afin de prédire avec une grande précision les probabilités de la classe de réponse pour les nouvelles observations.

  1. Complétez Exemple de Classification Random Forests®.
  2. Cliquez sur le bouton Prévoir au bas des résultats.
  3. Dans la liste déroulante, sélectionnez Entrer des valeurs individuelles.
  4. Saisissez les valeurs suivantes. Vous pouvez utiliser jusqu'à 3 valeurs. Il est important de choisir des valeurs qui se situent dans la plage des données d’origine.
    Âge 35 35  
    Pression artérielle de repos 140 140  
    Cholestérol 233 233  
    Fréquence cardiaque maximale 150 165  
    Vieux pic 2,3 2,3  
    Sexe Homme Femme  
    Type de douleur thoracique 2 1  
    Sucre de sang de jeûne Vrai Vrai  
    Repos ECG 0 1  
    Exercice Angina      
    Pente 1 3  
    Principaux navires 0 2  
    Thal Normale Normale  
  5. Cliquez sur OK.

Interpréter des résultats

Minitab utilise les arbres de classification Random Forests® Classification dans les résultats pour estimer la probabilité de classe d'un événement de diagnostic de maladie cardiaque pour l'ensemble de valeurs de prédiction. Les chercheurs constatent que la probabilité d'un événement de diagnostic de maladie cardiaque avec les paramètres spécifiés est d'environ 0,83 pour le premier ensemble et d'environ 0,62 pour le deuxième ensemble.

Random Forests® Classification: Maladies car vs Âge; Pression art; ...

Méthode Validation de modèle Validation avec données out-of-bag Nombre d'échantillons bootstrap 300 Effectifs d'échantillons Identique à la taille des données d'apprentissage de 303 Nombre de prédicteurs sélectionnés pour la partition des nœuds Racine carrée du nombre total de prédicteurs = 3 Taille minimale du nœud interne 2 Lignes utilisées 303
Informations de réponse binaire Variable Classe Dénombrement % Maladies cardiaques Oui (Événement) 139 45,87 Non 164 54,13 Tous 303 100,00
Prévoir... Random Forests® Prédire la classification

Prévision pour Maladies cardiaques

Configuration Âge = 35; Pression artérielle de repos = 140; Cholestérol = 233; Fréquence cardiaque maximale = 150; Vieux pic = 2,3; Sexe = Mâle; Type de douleur thoracique = 2; Sucre de sang de jeûne = Vrai; Repos ECG = 0; Exercice Angina = ""; Pente = 1; Principaux navires = 0; Thal = Normal
Prévision Prob. Prob. (classe (classe Obs. Classe = Oui) = Non) 1 Non 0,17 0,83

Prévision pour Maladies cardiaques

Configuration Âge = 35; Pression artérielle de repos = 140; Cholestérol = 233; Fréquence cardiaque maximale = 165; Vieux pic = 2,3; Sexe = Femelle; Type de douleur thoracique = 1; Sucre de sang de jeûne = Vrai; Repos ECG = 1; Exercice Angina = ""; Pente = 3; Principaux navires = 2; Thal = Normal
Prévision Prob. Prob. (classe (classe Obs. Classe = Oui) = Non) 2 Non 0,383333 0,616667