CART® 회귀 분석에 대한 수형도

기본적으로 Minitab은 최대 결정계수 값의 1 표준 오차 내에 결정계수 값을 가진 가장 작은 트리를 표시합니다.

수형도를 마우스 오른쪽 단추로 클릭하여 다음과 같은 교호작용을 수행합니다.
  • 노드에 대한 적합치에서 가장 작은 변동을 가진 5개의 노드를 강조 표시합니다. 이러한 노드는 최적 노드입니다.
  • 트리 기준에 따라 가장 높은 평균 또는 중위수를 가진 5개의 노드를 강조 표시합니다.
  • 트리 기준에 따라 가장 낮은 평균 또는 중위수를 가진 5개의 노드를 강조 표시합니다.
  • 선택한 노드로 이어지는 예측 변수의 값을 복사합니다. 이러한 값은 노드 규칙입니다.
  • 노드 분할 보기를 표시합니다. 이 보기는 큰 트리가 있고 노드를 분할하는 변수만 보려는 경우에 유용합니다.

루트 노드는 트리의 최상위 노드이며 부모가 없는 유일한 노드입니다. 각 노드에서 데이터는 데이터의 특성에 따라 2개의 자식으로 분할됩니다. 노드는 트리에서 분할할 데이터가 부족할 때까지 계속 분할됩니다. 즉, 터미널 노드는 추가 그룹화로 분할할 수 없습니다.

검정 데이터 세트를 사용하여 트리의 성능을 검증하면 수형도에 학습 데이터 세트의 사례가 표시됩니다.

해석

각 노드에는 평균, 표준 편차 및 카운트에 대한 세부 정보가 포함되어 있습니다.

노드 ID
노드 또는 터미널 노드 지정을 제공합니다. 터미널 노드는 더 이상 분할할 수 없는 최종 노드입니다.
평균
평균은 노드에 있는 사례의 평균 반응 값입니다. 평균은 동일한 노드에 속하는 새 데이터에 대한 예측 값입니다. 기타 터미널 노드와 가장 많이 다른 평균이 있는 터미널 노드는 해당 터미널 노드의 사례에 대한 예측 값이 가장 많이 다르므로 특별한 관심 영역일 수 있습니다. 예를 들어 최대 또는 최소 평균은 특별한 관심 영역일 수 있습니다.
표준 편차
표준 편차는 노드에 있는 반응 값의 표준 편차입니다. 표준 편차가 더 작은 터미널 노드는 표준 편차가 더 큰 터미널 노드보다 해당 노드의 예측 값이 더 정확하기 때문에 특별한 관심 영역일 수 있습니다.
전체 카운트
전체 카운트는 노드의 사례 수입니다. 분석에 가중치가 포함된 경우 카운트는 총 가중 카운트입니다. 이러한 노드는 더 일반적인 사례를 나타내기 때문에 많은 사례의 터미널 노드가 특별한 관심 영역일 수 있습니다.