CART® 분류에 대한 대립 트리 선택

통계분석 > 예측 분석 > CART® 분류를 실행합니다. 오분류 비용 대 단말 노드 수 그림에 대한 대립 트리 선택 단추를 클릭합니다.

개요

기본적으로 Minitab Statistical Software는 가장 작은 오분류 비용의 1개 표준 오차 내에서 오분류 비용으로 가장 작은 트리에 대한 출력을 생성합니다. Minitab을 사용하면 최적 트리를 식별하는 시퀀스에서 다른 트리를 탐색할 수 있습니다. 일반적으로 다음 두 가지 이유 중 하나에 대한 대립 트리를 선택합니다.
  • 최적의 트리는 오분류 비용이 감소하는 패턴의 일부입니다. 노드가 몇 개 더 있는 하나 이상의 트리는 동일한 패턴의 일부입니다. 일반적으로 최대한 많은 예측 정확도를 가진 트리에서 예측을 하려고 합니다. 트리가 충분히 단순하다면 이 트리를 사용하여 각 예측 변수가 반응 값에 미치는 영향을 이해할 수도 있습니다.
  • 최적의 트리는 오분류 비용이 상대적으로 평평한 패턴의 일부입니다. 모형 요약 통계가 비슷한 하나 이상의 트리에는 최적 트리보다 훨씬 적은 수의 노드가 있습니다. 일반적으로 터미널 노드 수가 더 적은 트리는 각 예측 변수가 반응 값에 미치는 영향을 보다 명확하게 파악할 수 있습니다. 더 작은 트리는 또한 쉽게 추가 연구에 대한 몇 가지 대상 그룹을 식별할 수 있습니다. 더 작은 트리에 대한 예측 정확도의 차이를 무시할 수 있는 경우 더 작은 트리를 사용하여 반응 변수와 예측 변수 간의 관계를 평가할 수도 있습니다.
예를 들어 다음 그림에서 노드가 4개인 트리가 최적의 트리입니다. 다음 두 개의 더 큰 트리는 오분류 비용이 감소하는 패턴의 일부입니다.
7-노드 트리의 오분류 비용은 4-노드 트리의 비용보다 적습니다. 7-노드 트리는 복잡성이 유사하므로 추가 예측 정확도가 있는 더 큰 트리를 사용하여 중요한 변수를 연구하고 예측을 수행할 수 있습니다.
대립 트리의 기준 값 외에도 트리의 복잡성과 다른 노드의 유용성을 비교할 수도 있습니다. 분석가가 다른 트리와 비교할 때 성능을 희생하지 않는 특정 트리를 선택하는 이유에 대한 다음 예를 생각해 보십시오.
  • 분석가는 가장 중요한 변수를 보다 명확하게 볼 수 있는 더 작은 트리를 선택합니다.
  • 분할은 다른 트리의 변수보다 측정하기 쉬운 변수에 있기 때문에 분석에서 트리를 선택합니다.
  • 특정 단말 노드에 관심이 있기 때문에 분석가가 트리를 선택합니다.

분석 수행

출력에서 대립 트리 선택을 클릭합니다. 그림, 수형도, 트리 또는 선택한 노드를 요약하는 표를 보여주는 대화 상자가 열립니다.

대립 트리 선택

대화 상자는 대립 트리를 선택하는 세 가지 방법을 제공합니다.
  • 그래프에서 한 점을 클릭합니다.
  • 모형 요약 표 아래의 화살표 단추를 클릭하여 현재 선택 영역보다 크거나 작은 트리를 선택합니다.
  • 단추를 클릭하여 일반적인 선택인 트리를 선택합니다. 분석에서 검증을 사용하지 않는 경우 표준 오차를 참조하는 단추가 적용되지 않습니다.
    최소 비용
    최소 오분류 비용으로 트리 선택
    1-SE 최소 비용
    최소 비용의 1개 표준 오차 내에서 오분류 비용이 있는 가장 작은 트리를 선택합니다.
    2-SE 최소 비용
    최소 비용의 2개 표준 오차 내에서 오분류 비용이 있는 가장 작은 트리를 선택합니다.
    최량 ROC
    ROC 곡선 아래에서 면적이 가장 큰 트리를 선택합니다.

트리 및 개별 노드 조사

트리는 도구 모음에서 다음과 같은 교호작용을 제공합니다.
  • 가장 순도가 높은 5개의 노드를 강조 표시합니다. 이러한 노드는 최적 노드입니다.
  • 자세한 트리노드 분할 트리 간에 전환합니다. 노드 분할 트리는 큰 트리가 있고 노드를 분할하는 변수만 보려는 경우에 유용합니다.
  • 트리를 확대/축소합니다.

트리의 개별 노드를 선택하여 표의 노드에 대한 세부 정보를 볼 수 있습니다. 세부 정보에는 개별 등급 수와 전체 카운트가 포함됩니다. 세부 정보에는 노드에 도착하는 규칙도 포함됩니다. 클립보드에 규칙 복사을 클릭하면 규칙을 다른 장소에 붙여넣을 수 있습니다.

전체 트리를 다시 선택하려면 개별 노드가 아닌 다이어그램을 클릭합니다.

새 트리 생성

트리 만들기을 클릭하여 선택한 대립 트리에 대한 결과를 만들고 저장합니다. 결과 및 저장에 대한 선택은 원래 트리와 동일합니다. 대립 트리의 그래프와 표가 새 출력 탭에 있습니다. 저장된 열은 원본 데이터가 있는 워크시트에 있습니다.