CART® 회귀 분석에 대한 최상 및 최악 터미널 노드의 적합치 및 오차 통계량

적합치 및 오차 통계를 사용하여 성능 때문에 특별한 관심 노드를 특성화합니다.

해석

표의 각 행은 노드의 적합 및 오차 통계를 표시합니다. 최량 노드는 최소 오차부터 최대 오차까지 순서대로 정렬됩니다. 최악 노드는 최대 오차부터 최소 오차까지 순서대로 정렬됩니다.

검정 데이터 세트를 사용하는 경우 Minitab은 학습 및 검정 데이터에 대한 별도의 통계를 계산합니다. 통계를 비교하여 학습 데이터와 새 데이터에 대한 트리의 상대적 성능을 검사할 수 있습니다. 검정 통계는 일반적으로 트리가 새 데이터에 대해 수행하는 방법을 더 잘 측정합니다.

적합
적합치는 노드에 있는 사례의 평균 반응 값입니다. 적합치는 동일한 노드에 속하는 새 데이터에 대한 예측 값입니다. 기타 터미널 노드와 다른 적합치가 있는 터미널 노드는 해당 터미널 노드의 사례에 대한 적합치가 다르게 되므로 특별한 관심 영역일 수 있습니다.
카운트
카운트는 노드의 사례 수입니다. 분석에 가중치가 포함된 경우 카운트는 가중 카운트입니다. 이러한 노드는 더 일반적인 사례를 나타내기 때문에 많은 사례의 터미널 노드가 특별한 관심 영역일 수 있습니다.
StDev
표준 편차는 노드에 있는 반응 값의 표준 편차입니다. 표준 편차가 더 작은 터미널 노드는 표준 편차가 더 큰 터미널 노드보다 해당 노드의 예측 값이 더 정확하기 때문에 특별한 관심 영역일 수 있습니다.
MSE
평균 제곱 오차(MSE)는 노드의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 MAPE에 더 큰 영향을 미칩니다.
MAD

평균 절대 편차(MAD)는 데이터와 동일한 단위로 정확도를 표현하므로 오차 양을 개념화하는 데 도움이 됩니다. 특이치는 MSE보다 MAD에 미치는 영향이 적습니다.

MAPE
평균 절대 백분율 오차(MAPE)는 정확도를 오차의 백분율로 표현합니다. MAPE는 백분율이므로 다른 정확도 측정 통계보다 이해하기가 더 쉬울 수 있습니다. 예를 들어 MAPE가 평균적으로 5인 경우 적합도는 5% 떨어집니다. 특이치는 MSE보다 MAPE에 미치는 영향이 적습니다.

그러나 노드가 데이터를 잘 적합시키는 것처럼 보이더라도 매우 큰 MAPE 값이 표시될 수 있습니다. 적합 대 실제 반응 값 그림을 검사하여 데이터 값이 0에 가까운지 확인합니다. MAPE는 절대 오차를 실제 데이터로 나누기 때문에 0에 가까운 값은 MAPE를 크게 팽창시킬 수 있습니다.