에 대한 트리 다이어그램 CART® 분류

기본적으로 Minitab은 오분류 비용이 최소 비용의 1 표준 오차 내에 있는 가장 작은 트리를 표시합니다.

수형도를 마우스 오른쪽 단추로 클릭하여 다음과 같은 교호작용을 수행합니다.
  • 가장 순수한 노드 5개를 강조 표시합니다. 이러한 노드는 최적 노드입니다.
  • 선택한 노드로 이어지는 예측 변수의 값을 복사합니다. 이러한 값은 노드 규칙입니다.
  • 노드 분할 보기를 표시합니다. 이 보기는 큰 트리가 있고 노드를 분할하는 변수만 보려는 경우에 유용합니다.

루트 노드는 트리의 맨 위 노드입니다. 부모가 없는 유일한 노드입니다. 각 노드에서 데이터는 데이터의 특성에 따라 2개의 자식으로 분할됩니다. 예를 들어, 심장 환자는 협심증이 있습니까? 노드는 트리에서 분할할 데이터가 부족할 때까지 계속 분할됩니다. 즉, 터미널 노드는 추가 그룹화로 분할할 수 없습니다.

검정 데이터 세트를 사용하여 트리의 성능을 검증하면 수형도에 학습 데이터 세트의 사례가 표시됩니다.

해석

수형도의 터미널 노드에 대한 경로는 순수 그룹이 형성되는 방법을 설명합니다. 터미널 노드는 추가 연구를 위해 예측 변수로 각 순수 그룹을 정의하는 방법에 대한 정보를 제공합니다. 터미널 노드에는 클래스, 개수 및 클래스의 백분율에 대한 세부 정보가 포함됩니다.

터미널 노드에 포함된 정보는 또한 사용자의 노력을 집중하기 위해 클래스 확률별로 모든 순수 그룹의 순위를 매길 수 있는 방법을 제공합니다.

노드 ID
노드 또는 터미널 노드 지정을 제공합니다. 터미널 노드는 더 이상 분할할 수 없는 최종 노드입니다.
등급
각 터미널 노드에는 클래스 할당 규칙에 따라 특정 클래스 할당이 있습니다. 이항 반응의 경우 클래스는 "예" 또는 "아니요"일 수 있습니다. 다항 반응의 경우 클래스는 "Q1", "Q2", "Q3" 및 "Q4"일 수 있습니다.
개수
특정 클래스의 사례 수입니다.
백분율
특정 클래스의 사례 비율입니다.
전체 카운트
모든 클래스에 대한 개수의 합계입니다.