Random Forests® 회귀 분석에 대한 최대 잔차로 인한 오차 통계의 백분율

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

오차 통계의 백분율을 사용하여 모형의 오류 양을 최악의 적합에서 검사합니다.

표의 각 행은 잔차의 지정된 백분율에 대한 오차 통계를 표시합니다. 최대 잔차에서 제공되는 평균 제곱 오차(MSE)의 백분율은 일반적으로 다른 두 통계의 백분율보다 높습니다. MSE는 계산에서 오차 제곱을 사용하므로 가장 극단적인 관측값은 일반적으로 통계에 가장 큰 영향을 미칩니다.

OOB 검증 외에 검정 집합을 사용한 검증을 선택하면 표에 OOB 데이터와 검정 집합 데이터에 대한 결과가 표시됩니다.

가능한 패턴은 잔차의 작은 비율이 데이터에 있는 오차의 상당 부분을 차지한다는 것입니다. 예를 들어 다음 표에서 데이터 세트의 총 크기는 약 2930입니다. MSE 관점에서 이는 데이터의 1%가 약 36%의 오차를 차지한다는 것을 나타냅니다. 이러한 경우 모형에 대부분의 오차를 기여하는 30개 사례는 트리를 개선할 수 있는 가장 자연스러운 기회를 나타낼 수 있습니다. 이러한 사례에서 적합도를 개선할 수 있는 방법을 찾으면 모형의 전반적인 성능이 상대적으로 크게 증가합니다.

이 조건은 최대 오차가 있는 사례가 없는 모형의 노드에 대한 신뢰도를 높일 수 있음을 나타낼 수도 있습니다. 대부분의 오차는 소수의 사례에서 비롯되므로 다른 사례에 대한 적합도가 상대적으로 더 정확합니다.

최대 잔차로 인한 오차 통계량의 퍼센트


OOB
최대 잔차의 비율(%)카운트% MSE% MAD% MAPE
1.03036.38559.584013.0409
2.05946.943414.834718.0932
2.57450.362216.995320.2317
3.08853.170118.888022.0186
4.011858.087922.552725.4151
5.014762.042525.784528.3840
7.522069.782432.950434.8161
10.029375.027338.850740.2386
15.044082.281648.688149.2733
20.058686.955756.561056.7304