결정계수 대 터미널 노드 수 그림에는 각 트리에 대한 결정계수 값이 표시됩니다. 기본적으로 초기 회귀 트리는 결정계수 값을 최대화하는 트리의 1 표준 오차 내에 결정계수 값을 가진 가장 작은 트리입니다. 분석에서 교차 검증 또는 검정 데이터 세트를 사용하는 경우 결정계수 값은 검증 표본에서 나온 것입니다. 검증 표본에 대한 값은 일반적으로 트리가 커질수록 평준화되고 결국 감소하기 시작합니다.
대립 트리 선택을 클릭하여 모형 요약 통계 표를 포함하는 대화형 그림을 엽니다. 그림을 사용하여 성능이 비슷한 대립 트리를 조사합니다.
트리를 선택한 후 수형도에서 고유 터미널 노드를 조사합니다. 예를 들어 평균이 크거나 표준 편차가 작은 노드에 관심이 있을 수 있습니다. 세부 보기에서 각 노드의 평균, 표준 편차 및 전체 카운트를 볼 수 있습니다.
수형도를 마우스 오른쪽 단추로 클릭하여 다음과 같은 교호작용을 수행합니다.
터미널 노드를 추가 그룹으로 분할할 수 없을 때까지 노드가 계속 분할됩니다. 다른 노드를 탐색하여 가장 흥미로운 변수를 확인합니다.
그런 다음 노드 2가 약물 남용의 빈도에 의해 분할되고 노드 8이 알코올 사용에 의해 분할됩니다. 터미널 노드 17에는 계획된 약물 치료 = 2, 알코올 사용 = 1, 추천 소스 = 3, 5, 6, 100, 300, 400, 600, 700 또는 800에 대한 사례가 있습니다. 연구원들은 터미널 노드 17에 가장 큰 평균, 최소 표준 편차 및 대부분의 사례가 있음을 주목합니다.
터미널 노드 1에는 가장 작은 평균과 약 4.3의 표준 편차가 있습니다. 터미널 노드 1의 평균은 약 5.9이고 반응 값은 음수일 수 없으므로 노드 통계에 따르면 터미널 노드 1의 데이터가 오른쪽으로 치우져 있음을 알 수 있습니다.
상대 변수 중요도 차트를 사용하여 트리에 가장 중요한 변수인 예측 변수를 확인합니다.
중요한 변수는 트리의 기본 또는 대체 분할입니다. 개선 점수가 가장 높은 변수가 가장 중요한 변수로 설정되고 다른 변수의 순위가 적절하게 매겨집니다. 상대 변수 중요도는 해석의 용이성을 위해 중요도 값을 표준화합니다. 상대적 중요도는 가장 중요한 예측 변수에 대한 백분율 개선으로 정의됩니다.
상대 변수 중요도 값의 범위는 0%에서 100%입니다. 가장 중요한 변수는 항상 100%의 상대적 중요도를 가집니다. 변수가 트리에 없는 경우 해당 변수는 중요하지 않습니다.