Verwendern Sie das folgende Verfahren, um die x- und y-Koordinaten für das Diagramm zu finden.
Angenommen, in der folgenden Tabelle wird ein Baum mit vier Endknoten zusammengefasst:
A: Endknoten | B: Anzahl der Ereignisse | C: Anzahl der Nicht-Ereignisse | D: Anzahl der Fälle | E: Schwellenwert (B/D) |
---|---|---|---|---|
4 | 18 | 12 | 30 | 0,60 |
1 | 25 | 42 | 67 | 0,37 |
3 | 12 | 44 | 56 | 0,21 |
2 | 4 | 32 | 36 | 0,11 |
Gesamt | 59 | 130 | 189 |
Im Folgenden sind die entsprechenden vier Tabellen mit ihren jeweiligen Falsch-Positiv-Raten und Richtig-Positiv-Raten auf zwei Dezimalstellen gerundet aufgeführt:
Prognostiziert | |||
---|---|---|---|
Ereignis | Nicht-Ereignis | ||
Beobachtet | Ereignis | 18 | 41 |
Nicht-Ereignis | 12 | 118 |
Prognostiziert | |||
---|---|---|---|
Ereignis | Nicht-Ereignis | ||
Beobachtet | Ereignis | 43 | 16 |
Nicht-Ereignis | 54 | 76 |
Prognostiziert | |||
---|---|---|---|
Ereignis | Nicht-Ereignis | ||
Beobachtet | Ereignis | 55 | 4 |
Nicht-Ereignis | 98 | 32 |
Prognostiziert | |||
---|---|---|---|
Ereignis | Nicht-Ereignis | ||
Beobachtet | Ereignis | 59 | 0 |
Nicht-Ereignis | 130 | 0 |
Führen Sie die gleichen Schritte wie beim Verfahren mit dem Trainingsdatensatz aus, berechnen Sie jedoch die Ereigniswahrscheinlichkeit aus den Fällen für den Testdatensatz.
Das Verfahren zum Definieren der x- und y-Koordinaten in der ROC-Kurve mit Kreuzvalidierung mit K Faltungen umfasst einen zusätzlichen Schritt. Durch diesen Schritt werden viele eindeutige Ereigniswahrscheinlichkeiten erzeugt. Angenommen, das Baumdiagramm enthält vier Endknoten. Es liegt eine Kreuzvalidierung mit 10 Faltungen vor. Verwenden Sie für die i-te Faltung den 9/10-Anteil der Daten, um die Ereigniswahrscheinlichkeiten für Fälle in Faltung i zu schätzen. Wird dieser Vorgang für jede Faltung wiederholt, beträgt die maximale Anzahl eindeutiger Ereigniswahrscheinlichkeiten 4 *10 = 40. Sortieren Sie anschließend alle eindeutigen Ereigniswahrscheinlichkeiten in absteigender Reihenfolge. Verwenden Sie die Ereigniswahrscheinlichkeiten als Schwellenwerte, um prognostizierte Klassen für Fälle im gesamten Datensatz zuzuweisen. Nach diesem Schritt bestimmen Sie mit den Schritten für den Trainingsdatensatz ab Schritt 3 bis zum Ende die x- und y-Koordinaten.