Random Forests® 회귀 분석에 대한 모형 요약 표

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

모형 요약 표에 대한 정의 및 해석 지침을 찾습니다. 검정 집합을 사용한 검증을 OOB 데이터를 사용한 검증에 추가하는 경우 Minitab는 두 검증 방법에 대한 결과를 표시합니다.

전체 예측 변수

Random Forests® 모형에 사용할 수 있는 총 예측 변수 수입니다. 합계는 지정한 계량형 및 범주형 예측 변수의 합계입니다.

중요한 예측 변수

Random Forests® 모형의 중요한 예측 변수 수입니다. 중요 예측 변수는 0.0보다 중요도 점수가 높습니다. 상대 변수 중요도 차트를 사용하여 상대 변수 중요도의 순서를 표시할 수 있습니다. 예를 들어 20개의 예측 변수 중 10개가 모형에서 중요하다고 가정하면 상대 변수 중요도 차트는 변수를 중요도 순서대로 표시합니다.

결정계수

R2는 모형에서 설명하는 반응의 변동 비율입니다.

해석

R2 결정계수를 사용하여 모형이 데이터를 얼마나 적합시키는지 확인합니다. R2 결정계수 값이 높을수록 모형이 데이터를 더 잘 적합시킵니다. R2 결정계수는 항상 0%에서 100% 사이입니다.

서로 다른 R2 결정계수 값의 의미를 그래픽으로 설명할 수 있습니다. 첫 번째 그림은 반응에서 변동의 85.5%를 설명하는 단순 회귀 분석 모형을 보여줍니다. 두 번째 그림은 반응에서 변동의 22.6%를 설명하는 모형을 보여줍니다. 모형에 의해 설명되는 변동이 많을수록 데이터 요소가 적합치에 가까워집니다. 이론적으로 모형이 변동의 100%를 설명할 수 있는 경우 적합치는 항상 관측치와 같으며 모든 데이터 요소가 y = x 선에 해당합니다.
참고

Random Forests®는 OOB 데이터를 사용하여 R2를계산하지만 모형을 적합하지 않기 때문에 모형이 과도 적합해도 문제가 되지 않습니다.

루트 평균 제곱 오차(RMSE)

루트 평균 제곱 오차(RMSE)는 모형의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 RMSE에 더 큰 영향을 미칩니다.

해석

다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다.

평균 제곱 오차(MSE)

평균 제곱 오차(MSE)는 모형의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 MAPE에 더 큰 영향을 미칩니다.

해석

다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다.

평균 절대 편차(MAD)

평균 절대 편차(MAD)는 데이터와 동일한 단위로 정확도를 표현하므로 오차 양을 개념화하는 데 도움이 됩니다. 특이치는 R2 결정계수, RMSE 및 MSE보다 MAD에 미치는 영향이 적습니다.

해석

다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다.

평균 절대 백분율 오차(MAPE)

평균 절대 백분율 오차(MAPE)는 반응 값의 크기에 대한 오차의 크기를 표현합니다. 따라서 크기가 동일한 오차는 더 큰 값보다 반응 변수의 더 작은 값에 대해 MAPE 값이 더 큽니다. MAPE는 백분율이므로 다른 정확도 측정 통계보다 이해하기가 더 쉬울 수 있습니다. 예를 들어 MAPE가 평균적으로 0.05인 경우 모든 사례에 걸쳐 적합 오차와 실제 값 간의 평균 비율은 5%입니다. 특이치는 R2 결정계수, RMSE 및 MSE보다 MAPE에 미치는 영향이 적습니다.

그러나 트리가 데이터를 잘 적합하는 것처럼 보이더라도 매우 큰 MAPE 값이 표시될 수 있습니다. 적합 대 실제 반응 값 그림을 검사하여 데이터 값이 0에 가까운지 확인합니다. MAPE는 절대 오차를 실제 데이터로 나누기 때문에 0에 가까운 값은 MAPE를 크게 팽창시킬 수 있습니다.

해석

다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다.