Exemple de prévision avec Module d'analyse prédictive

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Une équipe de chercheurs recueille et publie des informations détaillées sur les facteurs ayant une influence sur les maladies cardiaques. Les variables incluent l’âge, le sexe, les niveaux de cholestérol, la fréquence cardiaque maximale et plus encore. Cet exemple utilise un ensemble de données publiques comprenant des informations détaillées sur les maladies cardiaques. Les données d’origine proviennent du site archive.ics.uci.edu.

Les chercheurs peuvent utiliser le modèle d'arbres de classification Random Forests® afin de prédire les probabilités de classe de réponse pour les nouvelles observations.

  1. Complétez Exemple de Découvrir le meilleur modèle (réponse binaire).
  2. Dans le navigateur, sélectionnez les résultats pour Découvrir le meilleur modèle (réponse binaire).
  3. Cliquez sur le bouton Prévoir au bas des résultats.
  4. Dans la liste déroulante, sélectionnez Entrer des valeurs individuelles.
  5. Saisissez les valeurs suivantes. Cet exemple utilise deux valeurs pour chaque prédicteur, mais vous pouvez utiliser jusqu'à trois valeurs. Cet exemple utilise également intentionnellement les valeurs manquantes pour Exercice Angina.
    Âge 35 35  
    Pression artérielle de repos 140 140  
    Cholestérol 233 233  
    Fréquence cardiaque maximale 150 165  
    Vieux pic 2,3 2,3  
    Sexe 0 1  
    Type de douleur thoracique 2 1  
    Sucre de sang de jeûne 1 1  
    Repos ECG 0 1  
    Exercice Angina      
    Pente 1 2  
    Principaux navires 0 2  
    Thal 0 0  
  6. Cliquez sur OK.

Interpréter des résultats

Minitab utilise les arbres de classification Random Forests® Classification dans les résultats pour estimer la probabilité de classe d'un événement de diagnostic de maladie cardiaque pour l'ensemble de valeurs de prédiction. Les chercheurs constatent que la probabilité d'un événement de diagnostic de maladie cardiaque avec les paramètres spécifiés est d'environ 0,63 pour le premier ensemble et d'environ 0,52 pour le deuxième ensemble.

Classification Random Forests®: Maladies car vs Âge; Pression art; ...

Méthode Validation de modèle Validation avec données out-of-bag Nombre d'échantillons bootstrap 300 Effectif d'échantillon Identique à la taille des données d'apprentissage de 303 Nombre de prédicteurs sélectionnés pour la partition des nœuds Racine carrée du nombre total de prédicteurs = 3 Taille minimale du nœud interne 8 Lignes utilisées 303
Informations de réponse binaire Variable Classe Dénombrement % Maladies cardiaques 1 (Événement) 165 54,46 0 138 45,54 Tous 303 100,00

Prévision de classification Random Forests®

Prévision pour Maladies cardiaques

Configuration Âge = 35; Pression artérielle de repos = 140; Cholestérol = 233; Fréquence cardiaque maximale = 150; Vieux pic = 2,3; Sexe = 0; Type de douleur thoracique = 2; Sucre de sang de jeûne = 1; Repos ECG = 0; Exercice Angina = *; Pente = 1; Principaux navires = 0; Thal = 0
Prévision Prob. Prob. Obs. Classe (classe = 1) (classe = 0) 1 1 0,626667 0,373333

Prévision pour Maladies cardiaques

Configuration Âge = 35; Pression artérielle de repos = 140; Cholestérol = 233; Fréquence cardiaque maximale = 165; Vieux pic = 2,3; Sexe = 1; Type de douleur thoracique = 1; Sucre de sang de jeûne = 1; Repos ECG = 1; Exercice Angina = *; Pente = 2; Principaux navires = 2; Thal = 0
Prévision Prob. Prob. Obs. Classe (classe = 1) (classe = 0) 2 1 0,516667 0,483333