CART® 회귀 분석에 대한 잔차 상자 그림

잔차 상자 그림을 사용하여 트리의 전체 정확도를 평가합니다. 분석에서 검증 기술을 사용하는 경우 학습 및 검정 데이터에 대한 트리의 정확도를 비교할 수도 있습니다.

상자 그림은 실제 값과 적합치의 차이를 보여줍니다. 가장 가까운 사분위수 범위의 1.5배 이상인 점에는 개별 기호가 있습니다.

해석

이상적으로 잔차는 반응 변수의 배율을 기준으로 모두 0에 가깝습니다. 검증 기술을 사용하는 경우 Minitab은 학습 및 검정 데이터에 대해 별도의 그림을 만듭니다. 그림을 비교하여 학습 데이터와 새 데이터에 대한 트리의 상대적 성능을 검사할 수 있습니다. 학습 데이터와 검정 데이터 간에 조사할 차이를 나타낼 수 있는 다양한 패턴을 찾을 수도 있습니다.

이러한 상자 그림은 학습 및 검정 데이터 세트에 대해 유사한 결과를 표시합니다. 이러한 유사성은 새 데이터에 대한 트리의 성능이 학습 데이터에 대한 트리의 성능에 가깝다는 것을 시사합니다.

두 데이터 세트에 대한 상자 그림의 사분위수 범위는 약 -2.6에서 2.6입니다. 데이터의 50%는 이 범위 내에 잔차가 있습니다. 나머지 잔차는 더 큽니다. 사분위간 범위는 약 5이므로 대략적인 범위인 -10.5~10.5를 벗어난 잔차는 개별 기호를 갖습니다. 최대 잔차는 양 및 음의 방향으로 20에 가깝습니다. 이러한 큰 잔차는 트리가 모든 데이터를 적합하지 않음을 나타낼 수 있습니다.