와 에 대한 최대 잔차 모형 적합 주요 예측 변수 검색 에 의한 오류 통계의 백분율 TreeNet® 회귀 분석

참고

이 명령은 에서 사용할 수 있습니다예측 분석 모듈. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

오차 통계의 백분율을 사용하여 모형의 오류 양을 최악의 적합에서 검사합니다. 분석에서 검증 기법을 사용할 때는 학습 데이터와 검증 결과에 대한 모델 통계량을 비교할 수도 있습니다.

표의 각 행은 잔차의 지정된 백분율에 대한 오차 통계를 표시합니다. 최대 잔차에서 제공되는 평균 제곱 오차(MSE)의 백분율은 일반적으로 다른 두 통계의 백분율보다 높습니다. MSE는 계산에서 오차 제곱을 사용하므로 가장 극단적인 관측값은 일반적으로 통계에 가장 큰 영향을 미칩니다. MSE에 대한 오차 백분율과 다른 두 측정값 간의 큰 차이는 모형이 최소 제곱 오차 또는 최소 절대 편차가 있는 노드를 분할하는 선택에 더 민감하다는 것을 나타낼 수 있습니다.

검증 기법을 사용할 때, Minitab은 학습 데이터와 검증 결과에 대해 별도의 통계값을 계산합니다. 그림을 비교하여 학습 데이터와 새 데이터에 대한 모형의 상대적 통계를 검사할 수 있습니다. 검증 통계는 보통 모델이 새로운 데이터에 대해 어떻게 작동할지를 더 잘 측정하는 지표입니다.

가능한 패턴은 잔차의 작은 비율이 데이터에 있는 오차의 상당 부분을 차지한다는 것입니다. 예를 들어 다음 표에서 데이터 세트의 총 크기는 약 4400입니다. MSE의 관점에서 이는 데이터의 1%가 오류의 약 13%를 차지한다는 것을 나타냅니다. 이러한 경우 모형에 대부분의 오차를 기여하는 31개 사례는 트리를 개선할 수 있는 가장 자연스러운 기회를 나타낼 수 있습니다. 이러한 사례에서 적합도를 개선할 수 있는 방법을 찾으면 모형의 전반적인 성능이 상대적으로 크게 증가합니다.

이 조건은 최대 오차가 있는 사례가 없는 모형의 노드에 대한 신뢰도를 높일 수 있음을 나타낼 수도 있습니다. 대부분의 오차는 소수의 사례에서 비롯되므로 다른 사례에 대한 적합도가 상대적으로 더 정확합니다.

최대 잔차로 인한 오차 통계량의 퍼센트


교육검정
최대 잔차의 비율(%)카운트% MSE% MAD% MAPE카운트% MSE% MAD% MAPE
1.03113.28244.99978.08851421.69896.90829.0517
2.06221.37648.937412.99102731.939611.637714.0987
2.57724.712510.696714.99893335.793513.610616.1761
3.09327.931512.481717.01284039.802215.783818.4925
4.012333.297915.637220.46715345.825919.412422.4744
5.015438.170718.693723.77856650.829122.719425.9526
7.523147.900125.495431.01049859.700029.626433.2548
10.030755.376431.421637.078713166.433935.733339.2610
15.046166.746241.816747.274019675.485345.670348.6658
20.061474.806650.542955.544326181.629253.860356.3489