오차 행렬은 트리가 다음 메트릭을 사용하여 클래스를 올바르게 구분하는 방법을 보여줍니다.
진양성률(TPR) - 사건 사례가 올바르게 예측될 확률
가양성률(FPR) - 비사건 사례가 잘못 예측될 확률
가음성률(FNR) - 사건 사례가 잘못 예측될 확률
진음성률(TNR) - 비사건 사례가 올바르게 예측될 확률
해석
TreeNet® 분류: 심장 병 대 연령, 나머지 혈압, 콜레스테롤, 최대 심박수, 올드 피크, 섹스, 흉통 유형, 단식 혈당, ...
오차 행렬
예측된 등급(교육) 예측된 등급(검정)
실제 등급 카운트 예 아니요 정답률(%) 예 아니요 정답률(%)
예 (사건) 139 124 15 89.21 110 29 79.14
아니요 164 8 156 95.12 24 140 85.37
모두 303 132 171 92.41 134 169 82.51
행의 사건 확률이 0.5을 초과하는 경우 사건 등급에 행을 할당합니다.
통계량 교육(%) 검정(%)
진양성률(민감도 또는 검정력) 89.21 79.14
가양성률(유형 I 오차) 4.88 14.63
가음성률(유형 II 오차) 10.79 20.86
진음성률(특이성) 95.12 85.37
이 예제에서 예 사건의 전체 수는 139이고, 아니요 사건의 전체 수는 164입니다.
학습 데이터에서 예측된 사건(아니요) 수는 124이며, 89.21% 정확합니다.
학습 데이터에서 예측된 비사건(아니요) 수는 156이며, 95.12% 정확합니다.
검정 데이터에서 예측된 사건(예) 수는 110이며, 79.14% 정확합니다.
검정 데이터에서 예측된 비사건(아니요) 수는 140이며, 85.37% 정확합니다.
전반적으로 정확도 %는 학습 데이터의 경우 92.41%이고, 검정 데이터의 경우 82.51%입니다. 검정 데이터의 결과를 사용하여 새 관측치에 대한 예측 정확도를 평가합니다.
정확도 %의 낮은 값은 일반적으로 여러 가지 이유로 인해 발생할 수 있는 불완전한 적합된 모형 때문입니다. 정확도 %가 매우 낮은 경우 등급 무게가 도움이 될 수 있는지를 고려하십시오. 등급 무게는 한 등급의 관측치가 다른 등급의 관측치보다 더 많을 때 더 정확한 모형을 제공하는 데 도움이 될 수 있습니다. 또한 사례가 사건으로 분류되기 위해 필요한 확률을 변경할 수 있습니다.