CART® 회귀 분석에 대한 대립 트리 선택

통계분석 > 예측 분석 > CART® 회귀을 실행합니다.결정계수 대 단말 노드 수 그림 또는 평균 절대 편차 대 단말 노드 수 그림에 대한 대립 트리 선택 버튼을 클릭합니다.

개요

기본적으로 Minitab Statistical Software는 기준 값이 최량 값의 1 표준 오차 내에 있는 가장 작은 트리에 대한 결과를 생성합니다. 기준은 선택에 따라 최소 제곱 오차 또는 최소 절대 편차입니다. Minitab을 사용하면 최적 트리를 식별하는 시퀀스에서 다른 트리를 탐색할 수 있습니다. 일반적으로 다음 두 가지 이유 중 하나에 대한 대립 트리를 선택합니다.
  • Minitab이 선택하는 트리는 기준이 향상되는 패턴의 일부입니다. 노드가 몇 개 더 있는 하나 이상의 트리는 동일한 패턴의 일부입니다. 일반적으로 최대한 많은 예측 정확도를 가진 트리에서 예측을 하려고 합니다.
  • Minitab이 선택하는 트리는 기준이 비교적 평평한 패턴의 일부입니다. 모형 요약 통계가 비슷한 하나 이상의 트리에는 최적 트리보다 훨씬 적은 수의 노드가 있습니다. 일반적으로 터미널 노드 수가 더 적은 트리는 각 예측 변수가 반응 값에 미치는 영향을 보다 명확하게 파악할 수 있습니다. 더 작은 트리는 또한 쉽게 추가 연구에 대한 몇 가지 대상 그룹을 식별할 수 있습니다. 더 작은 트리에 대한 예측 정확도의 차이를 무시할 수 있는 경우 더 작은 트리를 사용하여 반응 변수와 예측 변수 간의 관계를 평가할 수도 있습니다.
예를 들어 다음 그림에는 21개의 노드가 있는 트리에 대한 결과가 함께 표시됩니다. 시퀀스의 다른 트리는 R2 값이 비슷합니다.
17노드 트리에는 21노드 트리만큼 높은 R2 결정계수 값이 있습니다. 일반적으로 터미널 노드 수가 더 적은 트리는 각 예측 변수가 반응 값에 미치는 영향을 보다 명확하게 파악할 수 있습니다. 더 작은 트리는 또한 쉽게 추가 연구에 대한 몇 가지 대상 그룹을 식별할 수 있습니다. 훨씬 더 작은 트리에 대한 예측 정확도의 감소를 무시할 수 있는 경우 훨씬 더 작은 트리를 사용하여 반응과 예측 변수 간의 관계를 평가할 수 있습니다.
대립 트리의 기준 값 외에도 트리의 복잡성과 다른 노드의 유용성을 비교할 수도 있습니다. 분석가가 다른 트리와 비교할 때 성능을 희생하지 않는 특정 트리를 선택하는 이유에 대한 다음 예를 생각해 보십시오.
  • 분석가는 가장 중요한 변수를 보다 명확하게 볼 수 있는 더 작은 트리를 선택합니다.
  • 분할은 다른 트리의 변수보다 측정하기 쉬운 변수에 있기 때문에 분석에서 트리를 선택합니다.
  • 특정 터미널 노드에 관심이 있기 때문에 분석가가 트리를 선택합니다.

분석 수행

출력에서 대립 트리 선택을 클릭합니다. 단말 노드 수에 대한 기준 그림, 수형도 및 트리 또는 선택한 노드를 요약하는 표를 보여주는 대화 상자가 열립니다.

기준 비교

대화 상자는 대립 트리를 선택하는 세 가지 방법을 제공합니다.
  • 그래프에서 한 점을 클릭합니다.
  • 그래프 오른쪽 하단의 화살표 단추를 클릭하여 현재 선택 영역보다 크거나 작은 트리를 선택합니다.
  • 단추를 클릭하여 일반적인 선택인 트리를 선택합니다. 선택 사항은 최적 트리에 대한 기준이 최소 제곱 오차 또는 최소 절대 편차인지에 따라 달라집니다. 분석에서 검증을 사용하지 않는 경우 표준 오차를 참조하는 단추가 적용되지 않습니다.
    최소 제곱 오차
    최대 R-제곱
    그림에서 최대 R2 결정계수 값을 가진 트리를 선택합니다.
    1-SE R-제곱
    최대 R2 결정계수 값의 1 표준 오차 내에서 R2 결정계수 값이 있는 가장 작은 트리를 선택합니다.
    2-SE R-제곱
    최대 R2 결정계수 값의 2 표준 오차 내에서 R2 결정계수 값이 있는 가장 작은 트리를 선택합니다.
    최소 절대 편차
    최소 MAD
    그림에서 최소 평균 절대 편차(MAD) 값을 가진 트리를 선택합니다.
    1-SE MAD
    최소 MAD 값의 1 표준 오차 내에서 MAD 값이 있는 가장 작은 트리를 선택합니다.
    2-SE MAD
    최소 MAD 값의 2 표준 오차 내에서 MAD 값이 있는 가장 작은 트리를 선택합니다.

트리 및 노드 조사

트리는 도구 모음에서 다음과 같은 교호작용을 제공합니다.
  • 노드에 대한 적합치에서 가장 작은 변동을 가진 5개의 노드를 강조 표시합니다. 이러한 노드는 최적 노드입니다.
  • 트리 기준에 따라 가장 높은 평균 또는 중위수를 가진 5개의 노드를 강조 표시합니다.
  • 트리 기준에 따라 가장 낮은 평균 또는 중위수를 가진 5개의 노드를 강조 표시합니다.
  • 자세한 트리노드 분할 트리 간에 전환합니다. 노드 분할 트리는 큰 트리가 있고 노드를 분할하는 변수만 보려는 경우에 유용합니다.
  • 트리를 확대/축소합니다.

트리의 개별 노드를 선택하여 표의 노드에 대한 세부 정보를 볼 수 있습니다. 세부 사항은 기준이 최대 R2이고 기준이 최적 편차인 경우 중위값이 가장 적은 경우 평균을 포함합니다. 세부 정보에는 노드의 표준 편차와 노드에 도착하는 규칙도 포함됩니다. 클립보드에 규칙 복사을 클릭하면 규칙을 다른 장소에 붙여넣을 수 있습니다.

전체 트리를 다시 선택하려면 개별 노드가 아닌 다이어그램을 클릭합니다.

새 트리 생성

트리 만들기을 클릭하여 선택한 대립 트리에 대한 결과를 만들고 저장합니다. 결과 및 저장에 대한 선택은 원래 트리와 동일합니다. 대립 트리의 그래프와 표가 새 출력 탭에 있습니다. 저장된 열은 원본 데이터가 있는 워크시트에 있습니다.