MARS® 회귀 분석에 대한 모형 요약 표

모형이 데이터를 얼마나 잘 적합시키는지 확인하려면 모형 요약 표의 통계량을 조사하십시오.

전체 예측 변수

모형에 사용할 수 있는 전체 예측 변수의 수입니다. 지정한 계량형 예측 변수와 범주형 예측 변수의 합계입니다.

중요한 예측 변수

모형에 있는 중요한 예측 변수의 수입니다. 중요 예측 변수는 모형에 1개 이상의 기저 함수가 있는 변수입니다.

해석

상대 변수 중요도 그림을 사용하여 상대 변수 중요도의 순서를 표시할 수 있습니다. 예를 들어, 20개의 예측 변수 중 10개가 모형에 기저 함수를 가지고 있다고 가정하면 상대 변수 중요도 그림에는 변수가 중요도 순서로 표시됩니다.

최대 기저 함수 수

알고리즘이 최적의 모델을 검색하기 위해 빌드하는 기저 함수의 수입니다.

해석

기본적으로 Minitab 통계 소프트웨어는 최대 기저 함수 수를 30으로 설정합니다. 30개의 기저 함수가 데이터에 비해 너무 작아 보이는 경우 더 큰 값을 고려하십시오. 예를 들어, 30개 이상의 예측 변수가 중요하다고 생각되는 경우 더 큰 값을 고려하십시오.

기본 함수의 최적 수

최적 모델의 기저 함수 수입니다.

해석

분석에서 최대 기저 함수 개수로 모형을 추정한 후 역방향 제거 절차를 사용하여 모형에서 기저 함수를 제거합니다. 분석은 모형 적합치에 가장 적게 기여하는 기저 함수를 하나씩 제거합니다. 각 단계에서 분석은 분석에 대한 최적성 기준의 값(R-제곱 또는 평균 절대 편차)을 계산합니다. 제거 절차가 완료된 후 최적의 기저 함수 수는 기준의 최적 값을 생성하는 제거 절차의 수입니다.

R-제곱

R2는 모형에서 설명하는 반응의 변동 비율입니다. 특이치는 MAD 및 MAPE보다 R2에 더 큰 영향을 미칩니다.

검증 방법을 사용하는 경우 표에는 학습 데이터 세트에 대한 R2 결정계수 통계와 검정 데이터 세트에 대한 R2 결정계수 통계가 포함됩니다. 검증 방법이 K-접기 교차 검증인 경우 모형 빌드에서 해당 접기를 제외할 때 검정 데이터 세트는 각 접기입니다. 검정 R2 결정계수 통계는 일반적으로 새 데이터에 대해 모형이 작동하는 방식을 더 잘 측정합니다.

해석

R2 결정계수를 사용하여 모형이 데이터를 얼마나 적합시키는지 확인합니다. R2 결정계수 값이 높을수록 모형이 데이터를 더 잘 적합시킵니다. R2 는 항상 0%와 100% 사이이다.

서로 다른 R2 결정계수 값의 의미를 그래픽으로 설명할 수 있습니다. 첫 번째 그림은 반응 변동의 85.5%를 설명하는 단순 회귀 모형을 보여줍니다. 두 번째 그림은 반응 변동의 22.6%를 설명하는 모형을 보여줍니다. 모형에 의해 설명되는 변동이 많을수록 데이터 요소가 적합치에 가까워집니다. 이론적으로 모형이 변동의 100%를 설명할 수 있는 경우 적합치는 항상 관측치와 같으며 모든 데이터 요소가 y = x 선에 해당합니다.

학습 R2보다 실질적으로 적은 검정 R2은 모형이 새 사례에 대한 반응 값을 예측하지 못할 수 있으며 모형이 현재 데이터 세트를 적합함을 나타냅니다.

루트 평균 제곱 오차(RMSE)

루트 평균 제곱 오차(RMSE)는 모형의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 RMSE에 더 큰 영향을 미칩니다.

검증 방법을 사용하는 경우 표에는 학습 데이터 세트에 대한 RMSE 통계와 검정 데이터 세트에 대한 RMSE 통계가 포함됩니다. 검증 방법이 k-폴드 교차 검증인 경우 모형 빌드에서 해당 폴드를 제외할 때 검정 데이터 세트는 각 폴드입니다. 검정 RMSE 통계는 일반적으로 새 데이터에 대해 모형이 작동하는 방식을 더 잘 측정합니다.

해석

다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 학습 RMSE보다 실질적으로 적은 검정 RMSE는 모형이 새 사례에 대한 반응 값을 예측하지 못할 수 있으며 모형이 현재 데이터 세트를 적합함을 나타냅니다.

평균 제곱 오차(MSE)

평균 제곱 오차(MSE)는 모형의 정확도를 측정합니다. 특이치는 MAD 및 MAPE보다 MAPE에 더 큰 영향을 미칩니다.

검증 방법을 사용하는 경우 표에는 학습 데이터 세트에 대한 MSE 통계와 검정 데이터 세트에 대한 MSE 통계가 포함됩니다. 검증 방법이 k-폴드 교차 검증인 경우 모형 빌드에서 해당 폴드를 제외할 때 검정 데이터 세트는 각 폴드입니다. 검정 MSE 통계는 일반적으로 새 데이터에 대해 모형이 작동하는 방식을 더 잘 측정합니다.

해석

다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 학습 MSE보다 실질적으로 적은 검정 MSE는 모형이 새 사례에 대한 반응 값을 예측하지 못할 수 있으며 모형이 현재 데이터 세트를 적합함을 나타냅니다.

평균 절대 편차(MAD)

평균 절대 편차(MAD)는 데이터와 동일한 단위로 정확도를 표현하므로 오차 양을 개념화하는 데 도움이 됩니다. 특이치는 R2 결정계수, RMSE 및 MSE보다 MAD에 미치는 영향이 적습니다.

검증 방법을 사용하는 경우 표에는 학습 데이터 세트에 대한 MAD 통계와 검정 데이터 세트에 대한 MAD 통계가 포함됩니다. 검증 방법이 k-폴드 교차 검증인 경우 모형 빌드에서 해당 폴드를 제외할 때 검정 데이터 세트는 각 폴드입니다. 검정 MAD 통계는 일반적으로 새 데이터에 대해 모형이 작동하는 방식을 더 잘 측정합니다.

해석

다른 모형의 적합을 비교하는 데 사용합니다. 값이 작을수록 더 잘 적합함을 나타냅니다. 학습 MAD보다 실질적으로 적은 검정 MAD는 모형이 새 사례에 대한 반응 값을 예측하지 못할 수 있으며 모형이 현재 데이터 세트를 적합함을 나타냅니다.