이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.
표의 각 행은 잔차의 지정된 백분율에 대한 오차 통계를 표시합니다. 최대 잔차에서 제공되는 평균 제곱 오차(MSE)의 백분율은 일반적으로 다른 두 통계의 백분율보다 높습니다. MSE는 계산에서 오차 제곱을 사용하므로 가장 극단적인 관측값은 일반적으로 통계에 가장 큰 영향을 미칩니다. MSE에 대한 오차 백분율과 다른 두 측정값 간의 큰 차이는 모형이 최소 제곱 오차 또는 최소 절대 편차가 있는 노드를 분할하는 선택에 더 민감하다는 것을 나타낼 수 있습니다.
검증 기술을 사용하는 경우 Minitab은 학습 데이터와 검정 데이터에 대한 별도의 통계를 계산합니다. 그림을 비교하여 학습 데이터와 새 데이터에 대한 모형의 상대적 통계를 검사할 수 있습니다. 검정 통계는 일반적으로 모형이 새 데이터에 대해 수행하는 방법을 더 잘 측정합니다.
가능한 패턴은 잔차의 작은 비율이 데이터에 있는 오차의 상당 부분을 차지한다는 것입니다. 예를 들어 다음 표에서 데이터 세트의 총 크기는 약 4400입니다. MSE의 관점에서 이는 데이터의 1%가 오류의 약 13%를 차지한다는 것을 나타냅니다. 이러한 경우 모형에 대부분의 오차를 기여하는 31개 사례는 트리를 개선할 수 있는 가장 자연스러운 기회를 나타낼 수 있습니다. 이러한 사례에서 적합도를 개선할 수 있는 방법을 찾으면 모형의 전반적인 성능이 상대적으로 크게 증가합니다.
이 조건은 최대 오차가 있는 사례가 없는 모형의 노드에 대한 신뢰도를 높일 수 있음을 나타낼 수도 있습니다. 대부분의 오차는 소수의 사례에서 비롯되므로 다른 사례에 대한 적합도가 상대적으로 더 정확합니다.
교육 | 검정 | |||||||
---|---|---|---|---|---|---|---|---|
최대 잔차의 비율(%) | 카운트 | % MSE | % MAD | % MAPE | 카운트 | % MSE | % MAD | % MAPE |
1.0 | 31 | 13.2824 | 4.9997 | 8.0885 | 14 | 21.6989 | 6.9082 | 9.0517 |
2.0 | 62 | 21.3764 | 8.9374 | 12.9910 | 27 | 31.9396 | 11.6377 | 14.0987 |
2.5 | 77 | 24.7125 | 10.6967 | 14.9989 | 33 | 35.7935 | 13.6106 | 16.1761 |
3.0 | 93 | 27.9315 | 12.4817 | 17.0128 | 40 | 39.8022 | 15.7838 | 18.4925 |
4.0 | 123 | 33.2979 | 15.6372 | 20.4671 | 53 | 45.8259 | 19.4124 | 22.4744 |
5.0 | 154 | 38.1707 | 18.6937 | 23.7785 | 66 | 50.8291 | 22.7194 | 25.9526 |
7.5 | 231 | 47.9001 | 25.4954 | 31.0104 | 98 | 59.7000 | 29.6264 | 33.2548 |
10.0 | 307 | 55.3764 | 31.4216 | 37.0787 | 131 | 66.4339 | 35.7333 | 39.2610 |
15.0 | 461 | 66.7462 | 41.8167 | 47.2740 | 196 | 75.4853 | 45.6703 | 48.6658 |
20.0 | 614 | 74.8066 | 50.5429 | 55.5443 | 261 | 81.6292 | 53.8603 | 56.3489 |