다음 프로세스를 사용하여 차트의 x 및 y 좌표를 찾습니다.
예를 들어 다음 표에서 4개의 터미널 노드가 있는 트리를 요약한다고 가정합니다.
A: 터미널 노드 | B: 사건 수 | C: 비사건 수 | D: 사례 수 | E: 분계점(B/D) |
---|---|---|---|---|
4 | 18 | 12 | 30 | 0.60 |
1 | 25 | 42 | 67 | 0.37 |
3 | 12 | 44 | 56 | 0.21 |
2 | 4 | 32 | 36 | 0.11 |
합계 | 59 | 130 | 189 |
다음은 가양성률과 소수점 2자리로 올림된 진양성률을 가진 해당 4개의 표입니다.
예측 | |||
---|---|---|---|
사건 | 비사건 | ||
관측 | 사건 | 18 | 41 |
비사건 | 12 | 118 |
예측 | |||
---|---|---|---|
사건 | 비사건 | ||
관측 | 사건 | 43 | 16 |
비사건 | 54 | 76 |
예측 | |||
---|---|---|---|
사건 | 비사건 | ||
관측 | 사건 | 55 | 4 |
비사건 | 98 | 32 |
예측 | |||
---|---|---|---|
사건 | 비사건 | ||
관측 | 사건 | 59 | 0 |
비사건 | 130 | 0 |
학습 데이터 세트 절차와 동일한 단계를 사용하지만 검정 테스트 세트의 사례에서 사건 확률을 계산합니다.
k-폴드 교차 검증을 사용하여 ROC 곡선 차트에서 x 및 y 좌표를 정의하는 절차에는 추가 단계가 있습니다. 이 단계에서는 여러 가지 고유한 사건 확률을 만듭니다. 예를 들어 수형도에 4개의 터미널 노드가 포함되어 있다고 가정합니다. 10-폴드 교차 검증이 있으면 그런 다음 i번째 접기의 경우 데이터의 9/10 부분을 사용하여 접기 i의 사례에 대한 사건 확률을 추정합니다. 이 프로세스가 각 접기에 대해 반복되면 고유 사건 확률의 최대 수는 4 *10 = 40입니다. 그런 다음 모든 고유한 사건 확률을 감소 순서로 정렬합니다. 사건 확률을 각 분계점으로 사용하여 전체 데이터 세트의 사례에 대해 예측된 클래스를 할당합니다. 이 단계 후 학습 데이터 세트 절차의 3단계에서 마지막 단계는 x 및 y 좌표를 찾기 위해 적용됩니다.