Beispiel für eine Prognose mit Random Forests®-Klassifikation

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Ein Forscherteam erfasst und veröffentlicht detaillierte Informationen zu Faktoren, die Herzerkrankungen beeinflussen. Variablen sind Alter, Geschlecht, Cholesterinspiegel, Maximalpuls und viele weitere. Dieses Beispiel basiert auf einem öffentlichen Datensatz, der detaillierte Informationen über Herzerkrankungen liefert. Die Originaldaten stammen von der Website archive.ics.uci.edu.

Der Forscher kann das Random Forests-Klassifikationsbaummodell verwenden, um die Klassenwahrscheinlichkeiten der Antwortvariablen für neue Beobachtungen zu prognostizieren.

  1. Arbeiten Sie das Beispiel für Random Forests®-Klassifikation durch.
  2. Klicken Sie auf die Schaltfläche Prognostizieren am unteren Rand der Ergebnisse.
  3. Wählen Sie in der Dropdown-Liste die Option Einzelwerte eingeben aus.
  4. Geben Sie die folgenden Werte ein. In diesem Beispiel werden 2 Werte für jeden Prädiktor verwendet, Sie können jedoch bis zu 3 Werte verwenden.
    Alter 35 35  
    Rest Blutdruck 140 140  
    Cholesterin 233 233  
    Max Herzfrequenz 150 165  
    Old Peak 2,3 2,3  
    Sex Männlich Weiblich  
    Brust Schmerz Typ 2 1  
    Fasten Blutzucker Wahr Wahr  
    Rest-EKG 0 1  
    Übung Angina      
    Steigung 1 3  
    Hauptblutgefäße 0 2  
    Thal Normalen Normalen  
  5. Klicken Sie auf OK.

Interpretieren der Ergebnisse

Minitab verwendet die Random Forests-Klassifikationsbäume in den Ergebnissen, um die Klassenwahrscheinlichkeit des Herzerkrankungs-Diagnoseereignisses für die Gruppe von Prognosewerten zu schätzen. Die Forscher stellen fest, dass die Wahrscheinlichkeit eines Herzerkrankungs-Diagnoseereignisses bei den angegebenen Einstellungen etwa 0,83 für die erste Gruppe und 0,62 für die zweite Gruppe beträgt.

Random Forests®-Klassifikation: Herzkrankhei vs Alter; Rest Blutdru; ...

Methode Modellvalidierung Validierung mit Daten von außerhalb des Segments Anzahl der Bootstrap-Stichproben 300 Stichprobenumfang Entspricht Umfang der Trainingsdaten von 303 Anzahl der für die Knotenteilung ausgewählten Prädiktoren Quadratwurzel der Gesamtanzahl der Prädiktoren = 3 Minimale interne Knotengröße 2 Verwendete Zeilen 303
Informationen zur binären Antwort Variable Klasse Anzahl % Herzkrankheiten 1 (Ereignis) 139 45,87 0 164 54,13 Alle 303 100,00
Prognostizieren... Random Forests®-Klassifikation Prognostizieren

Prognose für Herzkrankheiten

Einstellungen Alter = 35; Rest Blutdruck = 140; Cholesterin = 233; Max Herzfrequenz = 150; Old Peak = 2,3; Sex = Männlich; Brust Schmerz Typ = 2; Fasten Blutzucker = Wahr; Rest-EKG = 0; Übung Angina = ""; Steigung = 1; Hauptblutgefäße = 0; Thal = Normalen
Prognose Warsch. Warsch. (Klasse (Klasse Beob Klasse = 1) = 0) 1 0 0,17 0,83

Prognose für Herzkrankheiten

Einstellungen Alter = 35; Rest Blutdruck = 140; Cholesterin = 233; Max Herzfrequenz = 165; Old Peak = 2,3; Sex = Weiblich; Brust Schmerz Typ = 1; Fasten Blutzucker = Wahr; Rest-EKG = 1; Übung Angina = ""; Steigung = 3; Hauptblutgefäße = 2; Thal = Normalen
Prognose Warsch. Warsch. Beob Klasse (Klasse = 1) (Klasse = 0) 2 0 0,383333 0,616667