CART® 회귀 분석에 대한 터미널 노드별 반응 상자 그림

상자 그림은 각 터미널 노드에서 반응 변수의 분포에 대한 그래픽 요약을 제공합니다. 상자 그림을 사용하여 모양, 중심 경향 및 노드의 가변성을 비교합니다. 상자 그림은 터미널 노드의 사례 수가 20개보다 클 때 반응 값을 시각적으로 더 잘 표현합니다.

해석

기본적으로 노드는 최소 오차부터 최대 오차까지 순서대로 정렬됩니다. 분석을 실행하면 그래프 단추를 눌러 식별 번호로 노드를 정렬하는 옵션을 찾을 수 있습니다.

분석에서 검정 데이터 세트를 사용하는 경우 그래프에는 학습 및 검정 데이터에 대한 별도의 상자 그림이 포함됩니다. 검정 데이터에 대한 트리의 성능은 일반적으로 트리가 새 데이터에 대해 수행하는 방식을 더 잘 표현합니다. 검정 데이터와 학습 데이터 간의 큰 차이점을 조사해야 합니다.

다음 차트에서 가장 높은 중앙값 중 3개는 터미널 노드 17, 16 및 14에 대한 것이며, 최소 오차도 있습니다. 터미널 노드 1의 중앙값이 가장 작습니다. 터미널 노드 1과 3에는 하나의 특이치가 있고 특이치를 가진 다른 터미널 노드에는 1개 이상의 특이치가 있습니다. 터미널 노드 8에 대한 오차가 가장 큽니다.