Random Forests® 분류에 대한 오차 행렬

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

오차 행렬은 트리가 다음 메트릭을 사용하여 클래스를 올바르게 구분하는 방법을 보여줍니다.
  • 진양성률(TPR) - 사건 사례가 올바르게 예측될 확률
  • 가양성률(FPR) - 비사건 사례가 잘못 예측될 확률
  • 가음성률(FNR) - 사건 사례가 잘못 예측될 확률
  • 진음성률(TNR) - 비사건 사례가 올바르게 예측될 확률

해석

Random Forests® 분류: 심장 병 대 연령, 나머지 혈압, 콜레스테롤, 최대 심박수, 올드 피크, 섹스, 흉통 유형, ...

오차 행렬 예측 등급(OOB) 실제 등급 카운트 예 아니요 정답률(%) 예 (사건) 139 109 30 78.42 아니요 164 26 138 84.15 모두 303 135 168 81.52 통계량 OOB(%) 진양성률(민감도 또는 검정력) 78.42 가양성률(유형 I 오차) 15.85 가음성률(유형 II 오차) 21.58 진음성률(특이성) 84.15

이 예제에서 예 사건의 전체 수는 139이고, 아니요 사건의 전체 수는 164입니다. 이 분석은 OOB 데이터를 사용하여 모델의 유효성을 검사합니다.

OOB 데이터에서 예 사건의 전체 수는 139이고, 아니요 사건의 전체 수는 164입니다.
  • OOB 데이터의 예측된 사건 수(예)는 109건으로 78.42% 정확합니다.
  • OOB 데이터의 예측된 비사건(아니요)의 수는 138개로 84.15% 정확합니다.

전반적으로, OOB 데이터에 대한 정확도 %는 81.52 %입니다. OOB 데이터의 결과를 사용하여 새 관측치에 대한 예측 정확도를 평가합니다.

정확도 %의 낮은 값은 일반적으로 불완전한 적합된 모형 때문입니다. 문제가 다양하면 모형이 불완전해집니다. 정확도 %가 매우 낮은 경우 내부 노드를 분할하는 최소 사례 수를 수정할지 또는 분석이 노드 분할을 고려하는 예측 변수 수를 변경할지 여부를 고려합니다.