Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.
Für einen bestimmten Baum im Wald ist eine Klassenabstimmung für eine Zeile in den Daten von außerhalb des Segments die prognostizierte Klasse für die Zeile aus dem einzelnen Baum. Die prognostizierte Klasse für eine Zeile von Daten von außerhalb des Segment ist die Klasse mit der höchsten Stimmenanzahl unter allen Bäumen im Wald. Die prognostizierte Klassenwahrscheinlichkeit für eine Zeile in den Daten von außerhalb des Segments ist das Verhältnis zwischen der Anzahl der Stimmen für die Klasse und den Gesamtstimmen für die Zeile.
Beim Diagramm für die Daten von außerhalb des Segments stellt jeder Punkt im Diagramm eine eindeutige prognostizierte Klassenwahrscheinlichkeit dar. Die höchste Ereigniswahrscheinlichkeit ist der erste Punkt im Diagramm, der links außen angezeigt wird. Die anderen Wahrscheinlichkeiten sind absteigend geordnet.
Verwendern Sie das folgende Verfahren, um die x- und y-Koordinaten für das Diagramm zu finden.
Angenommen, die folgende Tabelle fasst ein vereinfachendes Modell mit zwei zweistufigen kategorialen Prädiktoren zusammen. Diese Prädiktoren ergeben vier eindeutige Ereigniswahrscheinlichkeiten, die auf 2 Dezimalstellen gerundet werden:
A: Reihenfolge | B: Prädiktor 1 | C: Prädiktor 2 | D: Anzahl der Ereignisse | E: Anzahl der Nicht-Ereignisse | F: Anzahl der Versuche | G: Schwellenwert (angepasste Ereigniswahrscheinlichkeit) |
---|---|---|---|---|---|---|
1 | 1 | 1 | 18 | 12 | 30 | 0,60 |
2 | 1 | 2 | 25 | 42 | 67 | 0,37 |
3 | 2 | 1 | 12 | 44 | 56 | 0,21 |
4 | 2 | 2 | 4 | 32 | 36 | 0,11 |
Gesamt | 59 | 130 | 189 |
Im Folgenden sind die entsprechenden vier Tabellen mit ihren jeweiligen Falsch-Positiv-Raten und Richtig-Positiv-Raten auf zwei Dezimalstellen gerundet aufgeführt:
Prognostiziert | |||
---|---|---|---|
Ereignis | Nicht-Ereignis | ||
Beobachtet | Ereignis | 18 | 41 |
Nicht-Ereignis | 12 | 118 |
Prognostiziert | |||
---|---|---|---|
Ereignis | Nicht-Ereignis | ||
Beobachtet | Ereignis | 43 | 16 |
Nicht-Ereignis | 54 | 76 |
Prognostiziert | |||
---|---|---|---|
Ereignis | Nicht-Ereignis | ||
Beobachtet | Ereignis | 55 | 4 |
Nicht-Ereignis | 98 | 32 |
Prognostiziert | |||
---|---|---|---|
Ereignis | Nicht-Ereignis | ||
Beobachtet | Ereignis | 59 | 0 |
Nicht-Ereignis | 130 | 0 |
Führen Sie die gleichen Schritte wie beim Verfahren mit Daten von außerhalb des Segments aus, berechnen Sie jedoch die Ereigniswahrscheinlichkeiten aus den Fällen für den Testdatensatz.