대립 트리 선택 카트® 분류

통계분석 > 예측 분석 > CART® 분류 실행합니다. 오분류 비용 대 단말 노드 수 그림다른 트리 선택 버튼을 클릭합니다.

개요

기본적으로 Minitab Statistical Software는 가장 작은 오분류 비용의 1개 표준 오차 내에서 오분류 비용으로 가장 작은 트리에 대한 출력을 생성합니다. Minitab을 사용하면 최적의 트리를 식별하는 시퀀스에서 다른 트리를 탐색할 수 있습니다. 일반적으로 다음 두 가지 이유 중 하나에 대한 대립 트리를 선택합니다.
  • 최적의 트리는 오분류 비용이 감소하는 패턴의 일부입니다. 노드가 몇 개 더 있는 하나 이상의 트리는 동일한 패턴의 일부입니다. 일반적으로 최대한 많은 예측 정확도를 가진 트리에서 예측을 하려고 합니다. 트리가 충분히 단순하다면 이 트리를 사용하여 각 예측 변수가 반응 값에 미치는 영향을 이해할 수도 있습니다.
  • 최적의 트리는 오분류 비용이 상대적으로 평평한 패턴의 일부입니다. 모형 요약 통계가 비슷한 하나 이상의 트리에는 최적의 트리보다 훨씬 적은 수의 노드가 있습니다. 일반적으로 터미널 노드 수가 더 적은 트리는 각 예측 변수가 반응 값에 미치는 영향을 보다 명확하게 파악할 수 있습니다. 더 작은 트리는 또한 쉽게 추가 연구에 대한 몇 가지 대상 그룹을 식별할 수 있습니다. 더 작은 트리에 대한 예측 정확도의 차이를 무시할 수 있는 경우 더 작은 트리를 사용하여 반응 변수와 예측 변수 간의 관계를 평가할 수도 있습니다.
예를 들어 다음 그림에서 노드가 4개인 트리가 최적의 트리입니다. 다음 두 개의 더 큰 트리는 오분류 비용이 감소하는 패턴의 일부입니다.
7-노드 트리의 오분류 비용은 4-노드 트리의 비용보다 적습니다. 7-노드 트리는 복잡성이 유사하므로 추가 예측 정확도가 있는 더 큰 트리를 사용하여 중요한 변수를 연구하고 예측을 수행할 수 있습니다.

분석 수행

출력에서 다른 트리 선택 을 클릭합니다. 그림과 모형 요약 표를 보여주는 대화 상자가 열립니다. 대화 상자는 대립 트리를 선택하는 세 가지 방법을 제공합니다.
  • 그래프에서 한 점을 클릭합니다.
  • 모형 요약 표 아래의 화살표 단추를 클릭하여 현재 선택 영역보다 크거나 작은 트리를 선택합니다.
  • 단추를 클릭하여 일반적인 선택인 트리를 선택합니다. 분석에서 검증을 사용하지 않는 경우 표준 오차를 참조하는 단추가 적용되지 않습니다.
    최소 비용
    최소 오분류 비용으로 트리 선택
    1-SE 최소 비용
    최소 비용의 1개 표준 오차 내에서 오분류 비용이 있는 가장 작은 트리를 선택합니다.
    2-SE 최소 비용
    최소 비용의 2개 표준 오차 내에서 오분류 비용이 있는 가장 작은 트리를 선택합니다.
    최량 ROC
    ROC 곡선 아래에서 면적이 가장 큰 트리를 선택합니다.

트리 만들기 을 클릭하여 선택한 대립 트리에 대한 결과를 만들고 저장합니다. 결과 및 저장에 대한 선택은 원래 트리와 동일합니다. 대립 트리의 그래프와 표가 새 출력 탭에 있습니다. 저장된 열은 원본 데이터가 있는 워크시트에 있습니다.

이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오