MARS® 회귀 분석에 대한 최대 잔차로 인한 오차 통계의 백분율

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

오차 통계의 백분율을 사용하여 모형의 오류 양을 최악의 적합에서 검사합니다. 분석에서 검증 기술을 사용하는 경우 학습 및 검정 데이터에 대한 모형의 통계를 비교할 수도 있습니다.

표의 각 행은 잔차의 지정된 백분율에 대한 오차 통계를 표시합니다. 최대 잔차에서 제공되는 평균 제곱 오차(MSE)의 백분율은 일반적으로 다른 두 통계의 백분율보다 높습니다. MSE는 계산에서 오차 제곱을 사용하므로 가장 극단적인 관측값은 일반적으로 통계에 가장 큰 영향을 미칩니다. MSE에 대한 오차 백분율과 다른 두 측정값 간의 큰 차이는 모형이 R-제곱 기준 또는 평균 절대 편차 기준을 사용하여 기저 함수를 선택하는 데 더 민감하다는 것을 나타낼 수 있습니다.

유효성 검사 기술을 사용하는 경우 결과에는 학습 데이터와 테스트 데이터에 대한 별도의 통계가 포함됩니다. 그림을 비교하여 학습 데이터와 새 데이터에 대한 모형의 상대적 통계를 검사할 수 있습니다. 검정 통계는 일반적으로 모형이 새 데이터에 대해 수행하는 방법을 더 잘 측정합니다.

가능한 패턴은 잔차의 작은 비율이 데이터에 있는 오차의 상당 부분을 차지한다는 것입니다. 예를 들어 다음 표에서 데이터 세트의 총 크기는 약 4400입니다. MSE의 관점에서 이는 데이터의 1%가 오류의 약 13%를 차지한다는 것을 나타냅니다. 이러한 경우 모형에 대부분의 오차를 기여하는 31개 사례는 트리를 개선할 수 있는 가장 자연스러운 기회를 나타낼 수 있습니다. 이러한 사례에서 적합도를 개선할 수 있는 방법을 찾으면 모형의 전반적인 성능이 상대적으로 크게 증가합니다.

이 조건은 최대 오차가 있는 사례가 없는 모형의 영역 대한 신뢰도를 높일 수 있음을 나타낼 수도 있습니다. 대부분의 오차는 소수의 사례에서 비롯되므로 다른 사례에 대한 적합도가 상대적으로 더 정확합니다.

최대 잔차로 인한 오차 통계량의 퍼센트


교육검정
최대 잔차의 비율(%)카운트% MSE% MAD% MAPE카운트% MSE% MAD% MAPE
1.03113.28244.99978.08851421.69896.90829.0517
2.06221.37648.937412.99102731.939611.637714.0987
2.57724.712510.696714.99893335.793513.610616.1761
3.09327.931512.481717.01284039.802215.783818.4925
4.012333.297915.637220.46715345.825919.412422.4744
5.015438.170718.693723.77856650.829122.719425.9526
7.523147.900125.495431.01049859.700029.626433.2548
10.030755.376431.421637.078713166.433935.733339.2610
15.046166.746241.816747.274019675.485345.670348.6658
20.061474.806650.542955.544326181.629253.860356.3489