모형이 데이터를 얼마나 잘 적합시키는지 확인하려면 모형 요약 표의 통계량을 조사하십시오.
모형에 사용할 수 있는 전체 예측 변수의 수입니다. 지정한 계량형 예측 변수와 범주형 예측 변수의 합계입니다.
모형에 있는 중요한 예측 변수의 수입니다. 중요 예측 변수는 모형에 1개 이상의 기저 함수가 있는 변수입니다.
상대 변수 중요도 그림을 사용하여 상대 변수 중요도의 순서를 표시할 수 있습니다. 예를 들어, 20개의 예측 변수 중 10개가 모형에 기저 함수를 가지고 있다고 가정하면 상대 변수 중요도 그림에는 변수가 중요도 순서로 표시됩니다.
알고리즘이 최적의 모델을 검색하기 위해 빌드하는 기저 함수의 수입니다.
기본적으로 Minitab 통계 소프트웨어는 최대 기저 함수 수를 30으로 설정합니다. 30개의 기저 함수가 데이터에 비해 너무 작아 보이는 경우 더 큰 값을 고려하십시오. 예를 들어, 30개 이상의 예측 변수가 중요하다고 생각되는 경우 더 큰 값을 고려하십시오.
최적 모델의 기저 함수 수입니다.
분석에서 최대 기저 함수 개수로 모형을 추정한 후 역방향 제거 절차를 사용하여 모형에서 기저 함수를 제거합니다. 분석은 모형 적합치에 가장 적게 기여하는 기저 함수를 하나씩 제거합니다. 각 단계에서 분석은 분석에 대한 최적성 기준의 값(R-제곱 또는 평균 절대 편차)을 계산합니다. 제거 절차가 완료된 후 최적의 기저 함수 수는 기준의 최적 값을 생성하는 제거 절차의 수입니다.
R2는 모형에서 설명하는 반응의 변동 비율입니다. 특이치는 MAD 및 MAPE보다 R2에 더 큰 영향을 미칩니다.
검증 방법을 사용할 때, 표에는 훈련 데이터셋에 R2 통계량과 검증 방법에 대한 R2 통계량이 포함됩니다. 검증 방법이 k-fold 교차 검증일 때, 트리 구축에서 해당 폴드가 제외될 때마다 검증은 각 폴드를 사용합니다. 검증 결과에서 나오는 R2 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
R2 결정계수를 사용하여 모형이 데이터를 얼마나 적합시키는지 확인합니다. R2 결정계수 값이 높을수록 모형이 데이터를 더 잘 적합시킵니다. R2 결정계수는 항상 0%에서 100% 사이입니다.
검증 R2 가 훈련 R2 보다 현저히 작다면, 모델이 현재 데이터셋에 적합하지 않더라도 새로운 사례의 반응 값을 잘 예측하지 못할 수 있음을 나타냅니다.
루트 평균 제곱 오차(RMSE)는 모형의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 MAPE에 더 큰 영향을 미칩니다.
검증 방법을 사용할 때, 표에는 학습 데이터 세트에 대한 RMSE 통계량과 검증 결과에 대한 RMSE 통계량이 포함됩니다. 검증 방법이 k-fold 교차 검증일 때, 트리 구축에서 해당 폴드가 제외될 때마다 검증은 각 폴드를 사용합니다. 검증 RMSE 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 검증 RMSE가 훈련 RMSE보다 현저히 낮다면, 모델이 현재 데이터셋에 적합하더라도 새로운 사례에 대한 반응 값을 예측하지 못할 수 있음을 의미합니다.
평균 제곱 오차(MSE)는 모형의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 MAPE에 더 큰 영향을 미칩니다.
검증 방법을 사용할 때, 표에는 학습 데이터 세트에 대한 MSE 통계량과 검증 결과에 대한 MSE 통계량이 포함됩니다. 검증 방법이 k-중개 교차 검증일 때, 모델 구축에서 해당 폴드가 제외될 경우 각 폴드를 사용합니다. 검증 MSE 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 검증 MSE가 훈련 MSE보다 현저히 낮다면, 모델이 현재 데이터셋에 적합하더라도 새로운 사례에 대한 반응 값을 예측하지 못할 수 있음을 의미합니다.
평균 절대 편차(MAD)는 데이터와 동일한 단위로 정확도를 표현하므로 오차 양을 개념화하는 데 도움이 됩니다. 특이치는 R2 결정계수, RMSE 및 MSE보다 MAD에 미치는 영향이 적습니다.
검증 방법을 사용할 때, 표에는 학습 데이터 세트에 대한 MAD 통계량과 검증 결과에 대한 MAD 통계량이 포함됩니다. 검증 방법이 k-중개 교차 검증일 때, 모델 구축에서 해당 폴드가 제외될 경우 각 폴드를 사용합니다. 검증 MAD 통계량은 일반적으로 새로운 데이터에 대해 모델이 어떻게 작동하는지 더 잘 측정합니다.
다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 검증 MAD가 훈련 MAD보다 현저히 낮다면, 모델이 현재 데이터셋에 적합하더라도 새로운 사례에 대한 반응 값을 예측하지 못할 수 있음을 의미합니다.