Beispiel für eine Prognose mit Bestes Modell ermitteln (binäre Antwort)

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Ein Forscherteam erfasst und veröffentlicht detaillierte Informationen zu Faktoren, die Herzerkrankungen beeinflussen. Variablen sind Alter, Geschlecht, Cholesterinspiegel, Maximalpuls und viele weitere. Dieses Beispiel basiert auf einem öffentlichen Datensatz, der detaillierte Informationen über Herzerkrankungen liefert. Die Originaldaten stammen von der Website archive.ics.uci.edu.

Der Forscher kann das Random Forests-Klassifikationsbaummodell verwenden, um die Klassenwahrscheinlichkeiten der Antwortvariablen für neue Beobachtungen zu prognostizieren.

  1. Arbeiten Sie das Beispiel für Bestes Modell ermitteln (binäre Antwort) durch.
  2. Wählen Sie im Navigator die Ergebnisse für Bestes Modell ermitteln (binäre Antwort) aus.
  3. Klicken Sie auf die Schaltfläche Prognostizieren am unteren Rand der Ergebnisse.
  4. Wählen Sie in der Dropdown-Liste die Option Einzelwerte eingeben aus.
  5. Geben Sie die folgenden Werte ein. In diesem Beispiel werden 2 Werte für jeden Prädiktor verwendet, Sie können jedoch bis zu 3 Werte verwenden. In diesem Beispiel werden auch absichtlich fehlende Werte für Übung Angina verwendet.
    Alter 35 35  
    Rest Blutdruck 140 140  
    Cholesterin 233 233  
    Max Herzfrequenz 150 165  
    Old Peak 2.3 2.3  
    Sex 0 1  
    Brust Schmerz Typ 2 1  
    Fasten Blutzucker 1 1  
    Rest-EKG 0 1  
    Übung Angina      
    Übung Angina 1 2  
    Übung Angina 0 2  
    Thal 0 0  
  6. Klicken Sie auf OK.

Interpretieren der Ergebnisse

Minitab verwendet die Random Forests® in den Ergebnissen, um die Klassenwahrscheinlichkeit des Herzerkrankungs-Diagnoseereignisses für die Gruppe von Prognosewerten zu schätzen. Die Forscher stellen fest, dass die Wahrscheinlichkeit eines Herzerkrankungs-Diagnoseereignisses bei den angegebenen Einstellungen etwa 0,63 für die erste Gruppe und 0,52 für die zweite Gruppe beträgt.

Random Forests®-Klassifikation: Herzkrankhei vs Alter; Rest Blutdru; ...

Methode Modellvalidierung Validierung mit Daten von außerhalb des Segments Anzahl der Bootstrap-Stichproben 300 Stichprobenumfang Entspricht Umfang der Trainingsdaten von 303 Anzahl der für die Knotenteilung ausgewählten Prädiktoren Quadratwurzel der Gesamtanzahl der Prädiktoren = 3 Minimale interne Knotengröße 8 Verwendete Zeilen 303
Informationen zur binären Antwort Variable Klasse Anzahl % Herzkrankheiten 1 (Ereignis) 165 54,46 0 138 45,54 Alle 303 100,00

Random Forests®-Klassifikation Prognostizieren

Prognose für Herzkrankheiten

Einstellungen Alter = 35; Rest Blutdruck = 140; Cholesterin = 233; Max Herzfrequenz = 150; Old Peak = 2,3; Sex = 0; Brust Schmerz Typ = 2; Fasten Blutzucker = 1; Rest-EKG = 0; Übung Angina = *; Steigung = 1; Hauptblutgefäße = 0; Thal = 0
Prognose Warsch. Warsch. Beob Klasse (Klasse = 1) (Klasse = 0) 1 1 0,626667 0,373333

Prognose für Herzkrankheiten

Einstellungen Alter = 35; Rest Blutdruck = 140; Cholesterin = 233; Max Herzfrequenz = 165; Old Peak = 2,3; Sex = 1; Brust Schmerz Typ = 1; Fasten Blutzucker = 1; Rest-EKG = 1; Übung Angina = *; Steigung = 2; Hauptblutgefäße = 2; Thal = 0
Prognose Warsch. Warsch. Beob Klasse (Klasse = 1) (Klasse = 0) 2 1 0,516667 0,483333