이 명령은 에예측 분석 모듈서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.
Minitab은 학습 데이터와 검증 결과 모두에 대한 결과를 표시합니다. 검증 결과는 모형이 새 관측치에 대한 반응 값을 적절하게 예측할 수 있는지 또는 반응과 예측 변수 간의 관계를 적절하게 요약할 수 있는지를 나타냅니다. 학습 결과를 사용하여 모형의 과도 적합을 평가합니다.
TreeNet® 모형에 사용할 수 있는 총 예측 변수 수입니다. 합계는 지정한 계량형 및 범주형 예측 변수의 합계입니다.
TreeNet® 모형의 중요한 예측 변수 수입니다. 중요 예측 변수는 0.0보다 중요도 점수가 높습니다. 상대 변수 중요도 차트를 사용하여 상대 변수 중요도의 순서를 표시할 수 있습니다. 예를 들어 20개의 예측 변수 중 10개가 모형에서 중요하다고 가정하면 상대 변수 중요도 차트는 변수를 중요도 순서대로 표시합니다.
기본적으로 Minitab은 300개의 작은 CART® 트리를 성장시켜 TreeNet® 모형을 생성합니다. 이 값은 데이터 탐색에 적합하지만 최종 모형을 생성하기 위해 더 많은 트리를 성장시킬지 여부를 고려하십시오. 성장한 트리 수를 변경하려면 옵션 하위 대화 상자로 이동합니다.
최적의 트리 수는 가장 높은 R2 값 또는 가장 낮은 MAD 값에 해당합니다.
최적의 트리 수가 모형이 성장하는 최대 트리 수에 가까우면 더 많은 트리를 사용하는 분석을 고려하십시오. 따라서 300개의 트리를 키우고 최적의 숫자가 298로 돌아오면 더 많은 트리를 사용하여 모형을 다시 빌드하십시오. 최적 수가 최대 수에 계속 가까워지면 트리 수를 계속 늘리십시오.
R2는 모형에서 설명하는 반응의 변동 비율입니다. 특이치는 MAD 및 MAPE보다 R2에 더 큰 영향을 미칩니다.
검증 방법을 사용할 때, 표에는 훈련 데이터셋에 R2 통계량과 검증 방법에 대한 R2 통계량이 포함됩니다. 검증 방법이 k-fold 교차 검증일 때, 트리 구축에서 해당 폴드가 제외될 때마다 검증은 각 폴드를 사용합니다. 검증 결과에서 나오는 R2 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
R2 결정계수를 사용하여 모형이 데이터를 얼마나 적합시키는지 확인합니다. R2 결정계수 값이 높을수록 모형이 데이터를 더 잘 적합시킵니다. R2 결정계수는 항상 0%에서 100% 사이입니다.
검증 R2 가 훈련 R2 보다 현저히 작다면, 모델이 현재 데이터셋에 적합하지 않더라도 새로운 사례의 반응 값을 잘 예측하지 못할 수 있음을 나타냅니다.
루트 평균 제곱 오차(RMSE)는 모형의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 MAPE에 더 큰 영향을 미칩니다.
검증 방법을 사용할 때, 표에는 학습 데이터 세트에 대한 RMSE 통계량과 검증 결과에 대한 RMSE 통계량이 포함됩니다. 검증 방법이 k-fold 교차 검증일 때, 트리 구축에서 해당 폴드가 제외될 때마다 검증은 각 폴드를 사용합니다. 검증 RMSE 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 검증 RMSE가 훈련 RMSE보다 훨씬 높다면, 모델이 현재 데이터셋에 적합하지 못한 경우에 대한 응답 값을 예측하지 못할 수 있음을 의미합니다.
평균 제곱 오차(MSE)는 모형의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 MAPE에 더 큰 영향을 미칩니다.
검증 방법을 사용할 때, 표에는 학습 데이터 세트에 대한 MSE 통계량과 검증 결과에 대한 MSE 통계량이 포함됩니다. 검증 방법이 k-중개 교차 검증일 때, 모델 구축에서 해당 폴드가 제외될 경우 각 폴드를 사용합니다. 검증 MSE 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 검증 MSE가 훈련 MSE보다 훨씬 높다면, 모델이 현재 데이터셋에 적합하지 못한 경우에 대한 응답 값을 예측하지 못할 수 있음을 의미합니다.
평균 절대 편차(MAD)는 데이터와 동일한 단위로 정확도를 표현하므로 오차 양을 개념화하는 데 도움이 됩니다. 특이치는 R2 결정계수, RMSE 및 MSE보다 MAD에 미치는 영향이 적습니다.
검증 방법을 사용할 때, 표에는 학습 데이터 세트에 대한 MAD 통계량과 검증 결과에 대한 MAD 통계량이 포함됩니다. 검증 방법이 k-중개 교차 검증일 때, 모델 구축에서 해당 폴드가 제외될 경우 각 폴드를 사용합니다. 검증 MAD 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 검증 MAD가 훈련 MAD보다 훨씬 높다면, 모델이 현재 데이터셋에 적합하지 못한 경우에 대한 응답 값을 예측하지 못할 수 있음을 의미합니다.
평균 절대 백분율 오차(MAPE)는 정확도를 오차의 백분율로 표현합니다. MAPE는 백분율이므로 다른 정확도 측정 통계보다 이해하기가 더 쉬울 수 있습니다. 예를 들어 MAPE가 평균적으로 0.05인 경우 모든 사례에 걸쳐 적합 오차와 실제 값 간의 평균 비율은 5%입니다. 특이치는 R2 결정계수, RMSE 및 MSE보다 MAPE에 미치는 영향이 적습니다.
그러나 트리가 데이터를 잘 적합하는 것처럼 보이더라도 매우 큰 MAPE 값이 표시될 수 있습니다. 적합 대 실제 반응 값 그림을 검사하여 데이터 값이 0에 가까운지 확인합니다. MAPE는 절대 오차를 실제 데이터로 나누기 때문에 0에 가까운 값은 MAPE를 크게 팽창시킬 수 있습니다.
검증 방법을 사용할 때, 표에는 학습 데이터 세트에 대한 MAPE 통계량과 검증 결과에 대한 MAPE 통계량이 포함됩니다. 검증 방법이 k-중개 교차 검증일 때, 모델 구축에서 해당 폴드가 제외될 경우 각 폴드를 사용합니다. 검증 MAPE 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 검증 MAPE가 훈련 MAPE보다 훨씬 높다면, 모델이 현재 데이터셋에 적합하지 못한 경우에 대한 응답 값을 예측하지 못할 수 있음을 의미합니다.