TreeNet® 회귀 분석를 통한 모형 적합주요 예측 변수 검색에 대한 최대 잔차로 인한 오차 통계의 백분율

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

오차 통계의 백분율을 사용하여 모형의 오류 양을 최악의 적합에서 검사합니다. 분석에서 검증 기술을 사용하는 경우 학습 및 검정 데이터에 대한 모형의 통계를 비교할 수도 있습니다.

표의 각 행은 잔차의 지정된 백분율에 대한 오차 통계를 표시합니다. 최대 잔차에서 제공되는 평균 제곱 오차(MSE)의 백분율은 일반적으로 다른 두 통계의 백분율보다 높습니다. MSE는 계산에서 오차 제곱을 사용하므로 가장 극단적인 관측값은 일반적으로 통계에 가장 큰 영향을 미칩니다. MSE에 대한 오차 백분율과 다른 두 측정값 간의 큰 차이는 모형이 최소 제곱 오차 또는 최소 절대 편차가 있는 노드를 분할하는 선택에 더 민감하다는 것을 나타낼 수 있습니다.

검증 기술을 사용하는 경우 Minitab은 학습 데이터와 검정 데이터에 대한 별도의 통계를 계산합니다. 그림을 비교하여 학습 데이터와 새 데이터에 대한 모형의 상대적 통계를 검사할 수 있습니다. 검정 통계는 일반적으로 모형이 새 데이터에 대해 수행하는 방법을 더 잘 측정합니다.

가능한 패턴은 잔차의 작은 비율이 데이터에 있는 오차의 상당 부분을 차지한다는 것입니다. 예를 들어 다음 표에서 데이터 세트의 총 크기는 약 4400입니다. MSE의 관점에서 이는 데이터의 1%가 오류의 약 13%를 차지한다는 것을 나타냅니다. 이러한 경우 모형에 대부분의 오차를 기여하는 31개 사례는 트리를 개선할 수 있는 가장 자연스러운 기회를 나타낼 수 있습니다. 이러한 사례에서 적합도를 개선할 수 있는 방법을 찾으면 모형의 전반적인 성능이 상대적으로 크게 증가합니다.

이 조건은 최대 오차가 있는 사례가 없는 모형의 노드에 대한 신뢰도를 높일 수 있음을 나타낼 수도 있습니다. 대부분의 오차는 소수의 사례에서 비롯되므로 다른 사례에 대한 적합도가 상대적으로 더 정확합니다.

TreeNet® 회귀: 대출 금액 대 연간 소득, 소득 비율, 프런트 엔드 비율, 백 엔드 비율, 대출자 수, 나이, ...

최대 잔차로 인한 오차 통계량의 퍼센트 교육 검정 최대 잔차의 비율(%) 카운트 % MSE % MAD % MAPE 카운트 % MSE % MAD % MAPE 1.0 31 13.2824 4.9997 8.0885 14 21.6989 6.9082 9.0517 2.0 62 21.3764 8.9374 12.9910 27 31.9396 11.6377 14.0987 2.5 77 24.7125 10.6967 14.9989 33 35.7935 13.6106 16.1761 3.0 93 27.9315 12.4817 17.0128 40 39.8022 15.7838 18.4925 4.0 123 33.2979 15.6372 20.4671 53 45.8259 19.4124 22.4744 5.0 154 38.1707 18.6937 23.7785 66 50.8291 22.7194 25.9526 7.5 231 47.9001 25.4954 31.0104 98 59.7000 29.6264 33.2548 10.0 307 55.3764 31.4216 37.0787 131 66.4339 35.7333 39.2610 15.0 461 66.7462 41.8167 47.2740 196 75.4853 45.6703 48.6658 20.0 614 74.8066 50.5429 55.5443 261 81.6292 53.8603 56.3489