次の手順に従って、チャートのx座標とy座標を計算します。
たとえば、次の表に、4つのターミナルノードがある木を要約するとします。
A:ターミナルノード | B:事象数 | C:非事象数 | D:ケースの数 | E:しきい値 (B/D) |
---|---|---|---|---|
4 | 18 | 12 | 30 | 0.60 |
1 | 25 | 42 | 67 | 0.37 |
3 | 12 | 44 | 56 | 0.21 |
2 | 4 | 32 | 36 | 0.11 |
合計 | 59 | 130 | 189 |
次に、対応する4つの表に、それぞれの偽陽性率および真陽性率を、小数点以下2桁で示します。
予測値 | |||
---|---|---|---|
事象 | 非事象 | ||
観測 | 事象 | 18 | 41 |
非事象 | 12 | 118 |
予測値 | |||
---|---|---|---|
事象 | 非事象 | ||
観測 | 事象 | 43 | 16 |
非事象 | 54 | 76 |
予測値 | |||
---|---|---|---|
事象 | 非事象 | ||
観測 | 事象 | 55 | 4 |
非事象 | 98 | 32 |
予測値 | |||
---|---|---|---|
事象 | 非事象 | ||
観測 | 事象 | 59 | 0 |
非事象 | 130 | 0 |
トレーニングデータセットの手段と同じ手順を使用しますが、テストデータセットのケースから事象確率を計算します。
K分割交差検証を使用してROC曲線チャート上のx座標とy座標を定義する手順には、追加のステップがあります。このステップにより、多くの異なる事象確率が生成されます。たとえば、ツリー図に4つのターミナルノードがあるとします。私たちは10分割交差検証を行います。次に、i番目の分割で、データの9/10の部分を使用して、分割iのケースの事象確率を推定します。このプロセスを各分割で繰り返す場合、個別の事象確率の最大数は4 *10 = 40です。その後、すべての個別の事象確率を降順に並べ替えます。データセット全体の場合に関して予測クラスを割り当てるには、各しきい値として事象確率を使用します。この手順の後、トレーニングデータセットの3から最後までのステップを適用し、x座標とy座標を計算します。