Random Forests® 분류에 대한 오차 행렬

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

오차 행렬은 트리가 다음 메트릭을 사용하여 클래스를 올바르게 구분하는 방법을 보여줍니다.
  • 진양성률(TPR) - 사건 사례가 올바르게 예측될 확률
  • 가양성률(FPR) - 비사건 사례가 잘못 예측될 확률
  • 가음성률(FNR) - 사건 사례가 잘못 예측될 확률
  • 진음성률(TNR) - 비사건 사례가 올바르게 예측될 확률

해석

오차 행렬


예측 등급(OOB)
실제 등급카운트아니요정답률(%)
예 (사건)1391093078.42
아니요1642613884.15
모두30313516881.52
통계량OOB(%)
진양성률(민감도 또는 검정력)78.42
가양성률(유형 I 오차)15.85
가음성률(유형 II 오차)21.58
진음성률(특이성)84.15

이 예제에서 예 사건의 전체 수는 139이고, 아니요 사건의 전체 수는 164입니다. 이 분석은 OOB 데이터를 사용하여 모델의 유효성을 검사합니다.

OOB 데이터에서 예 사건의 전체 수는 139이고, 아니요 사건의 전체 수는 164입니다.
  • OOB 데이터의 예측된 사건 수(예)는 109건으로 78.42% 정확합니다.
  • OOB 데이터의 예측된 비사건(아니요)의 수는 138개로 84.15% 정확합니다.

전반적으로, OOB 데이터에 대한 정확도 %는 81.52 %입니다. OOB 데이터의 결과를 사용하여 새 관측치에 대한 예측 정확도를 평가합니다.

정확도 %의 낮은 값은 일반적으로 불완전한 적합된 모형 때문입니다. 문제가 다양하면 모형이 불완전해집니다. 정확도 %가 매우 낮은 경우 내부 노드를 분할하는 최소 사례 수를 수정할지 또는 분석이 노드 분할을 고려하는 예측 변수 수를 변경할지 여부를 고려합니다.