오차 행렬의 모든 통계에 대한 정의 및 해석을 찾습니다.
오차 행렬은 트리가 다음 메트릭을 사용하여 클래스를 올바르게 구분하는 방법을 보여줍니다.
  • 진양성률(TPR) - 사건 사례가 올바르게 예측될 확률
  • 가양성률(FPR) - 비사건 사례가 잘못 예측될 확률
  • 가음성률(FNR) - 사건 사례가 잘못 예측될 확률
  • 진음성률(TNR) - 비사건 사례가 올바르게 예측될 확률

해석

7 노드 CART® 분류: 심장 병 대 연령, 나머지 혈압, 콜레스테롤, 최대 심박수, 올드 피크, 섹스, 단식 혈당, 운동 협 심 증, 레스트 심전도, 경사, 탈, 흉통 유형, 주요 선박

오차 행렬 예측된 등급(교육) 예측된 등급(검정) 실제 등급 카운트 예 아니요 정답률(%) 예 아니요 정답률(%) 예 (사건) 139 117 22 84.2 105 34 75.5 아니요 164 22 142 86.6 24 140 85.4 모두 303 139 164 85.5 129 174 80.9 통계량 교육(%) 검정(%) 진양성률(민감도 또는 검정력) 84.2 75.5 가양성률(유형 I 오차) 13.4 14.6 가음성률(유형 II 오차) 15.8 24.5 진음성률(특이성) 86.6 85.4

이 예제에서 예 사건의 전체 수는 139이고, 아니요 사건의 전체 수는 164입니다.
  • 학습 데이터에서 예측된 예 사건의 수는 117이며, 84.2% 정확합니다.
  • 학습 데이터에서 예측된 아니요 사건 수는 142이며, 86.6% 정확합니다.
  • 검정 데이터에서 예측된 예 사건 수는 105이며, 75.5% 정확합니다.
  • 검정 데이터에서 예측된 아니요 사건 수는 140이며, 80.9% 정확합니다.
전반적으로 정확도 %는 학습 데이터의 경우 85.5%이고, 검정 데이터의 경우 80.9%입니다.
  • 진양성률(TPR) - 학습 데이터의 경우 84.2%, 검정 데이터의 경우 75.5%입니다.
  • 가양성률(FPR) - 학습 데이터의 경우 13.4%, 검정 데이터의 경우 14.6%입니다.