오분류 비용 대 터미널 노드 수 플롯 CART® 분류

가장 정확한 트리는 오분류 비용이 가장 낮은 트리입니다. 이 트리를 최적의 트리라고도 합니다.

때로는 오분류 비용이 약간 더 높은 간단한 트리도 작동합니다. 일반적으로 터미널 노드 수가 더 적은 트리는 각 예측 변수가 반응 값에 미치는 영향을 보다 명확하게 파악할 수 있습니다. 더 작은 트리는 또한 쉽게 추가 연구에 대한 몇 가지 대상 그룹을 식별할 수 있습니다. 더 작은 트리에 대한 예측 정확도의 차이를 무시할 수 있는 경우 더 작은 트리를 사용하여 반응과 예측 변수 간의 관계를 평가할 수 있습니다.

모형 요약 통계량 표가 포함된 그림의 대화형 보기를 열려면 클릭합니다 대립 트리 선택 . 그림을 사용하여 성능이 비슷한 작은 트리를 조사합니다.

해석

이 예제에서는 4개의 터미널 노드가 있는 트리에는 트리 생성 기준이 최소 오분류 비용의 1 표준 오차 내에 오분류 비용이 있는 가장 작은 트리이기 때문에 "최적"이라는 레이블이 있습니다. 4개의 터미널 노드가 있는 트리의 분류 비용은 약 0.415입니다. 6개의 터미널 노드가 있는 트리의 오분류 비용은 약 0.397입니다. 7개의 터미널 노드가 있는 트리의 최소 오분류 비용은 약 0.391입니다. 4개의 터미널 노드가 있는 초기 트리는 다른 트리에 대한 결과를 만드는 데 사용할 대립 트리 선택 때 "최적" 레이블을 유지합니다.