부분 최소 제곱법에 대한 모형 선택 및 검증 표

모형 선택 표의 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

성분

성분은 각 모형에 포함된 성분의 수를 나타냅니다. Minitab은 사용자가 지정한 성분 수가 모형에 포함될 때까지 성분이 1개, 2개 등인 모형을 표시합니다. 모형에 포함할 성분 수를 지정하지 않은 경우, Minitab은 10개 성분 또는 예측 변수 수 중 더 적은 수의 모형 선택 통계량을 표시합니다.

x-분산

x-분산은 항의 분산 가운데 모형에 의해 설명되는 양입니다. x-분산 값은 0과 1 사이입니다.

x-분산 값이 1에 가까울수록 성분이 원래 항 집합을 더 잘 나타냅니다. 반응값이 2개 이상인 경우 x-분산 값은 모든 반응값에 대해 같습니다.

오차

오차는 잔차 제곱합인 오차 제곱합입니다. 이 오차는 모형으로 설명되지 않는 데이터의 변동을 수량화합니다. 마지막 모형의 경우 오차는 마지막 모형에 대한 AVOVA 표의 잔차 오차에 대한 제곱합과 일치합니다.

R-제곱

R2은 모형에 의해 설명되는 반응 내 변동의 백분율입니다. 이 값은 1 빼기 오차 제곱합(모형에 의해 설명되지 않는 변동) 대 총 제곱합(모형 내 총 변동)의 비율입니다.

해석

모형이 데이터를 얼마나 잘 적합시키는지 확인하려면 R2을 사용합니다. R2 값이 클수록 모형이 데이터를 더 잘 적합시킵니다. R2은 항상 0%에서 100% 사이입니다.

적합선 그림을 사용하여 여러 R2 값을 그래픽으로 표시할 수 있습니다. 첫 번째 그림은 반응에 있는 변동의 85.5%를 설명하는 단순 회귀 모형을 나타냅니다. 두 번째 그림은 반응에 있는 변동의 22.6%를 설명하는 모형을 나타냅니다. 모형에서 설명하는 변동이 많을수록 데이터 점이 적합 회귀선에 더 가깝습니다. 이론적으로 모형이 변동의 100%를 설명할 수 있는 경우 적합치는 항상 관측치와 같으며 모든 데이터 점이 적합 회귀선에 가깝습니다. 그러나 R2이 100%이더라도 모형이 반드시 새 관측치를 잘 예측하는 것은 아닙니다.
R2 값을 해석하는 경우 다음과 같은 문제를 고려하십시오.
  • 모형에 예측 변수를 추가하면 R2은 항상 증가합니다. 예를 들어, 최량 예측 변수가 5개인 모형은 최량 예측 변수가 4개인 모형보다 항상 R2 값이 큽니다. 따라서 R2은 같은 크기의 모형을 비교할 때 가장 유용합니다.

  • 작은 표본은 반응과 예측 변수 간 관계의 강도에 대한 정확한 추정치를 제공하지 않습니다. 예를 들어, 더 정확한 R2이 필요하면 더 큰 표본을 사용해야 합니다(일반적으로 40 이상).

  • 적합도 통계량은 모형이 데이터를 얼마나 잘 적합시키는 지에 대한 하나의 측도에 지나지 않습니다. 모형에 바람직한 값이 있더라도 해당 모형이 모형 가정을 충족하는지 확인하려면 잔차 그림을 확인해야 합니다.

R-제곱(예측)

예측 R2은 계산된 각 모형이 반응 값을 예측하는 정도를 나타내며 교차 검증을 수행하는 경우에만 계산됩니다. 데이터에 반응 변수가 하나 있는 경우 Minitab은 예측 R2 값이 가장 큰 모형을 선택합니다. 데이터에 반응 변수가 여러 개 있는 경우 Minitab은 모든 반응 변수에 대한 평균 예측 R2 값이 가장 큰 PLS 모형을 선택합니다. 예측 R2은 데이터 집합에서 각 관측치를 체계적으로 제거하고 회귀 방정식을 추정하며 모형이 제거된 관측치를 얼마나 잘 예측하는지 결정하여 계산됩니다. 예측 R2 값의 범위는 0%와 100% 사이입니다. (계산 결과 예측 R2 값이 음수가 될 수 있지만, Minitab에서는 이 경우 0을 표시합니다.)

해석

모형의 새 관측치에 대한 반응을 얼마나 잘 예측하는지 확인하려면 예측 R2을 사용합니다.모형의 예측 R2 값이 클수록 예측 능력이 더 좋습니다.

예측 R2이 R2보다 상당히 작으면 모형이 과다 적합하다는 것을 나타낼 수도 있습니다. 모집단에서 중요하지 않은 효과에 대한 항을 추가할 경우 과다 적합 모형이 발생할 수 있습니다. 모형이 표본 데이터에 따라 조정되므로, 모집단에 대해 예측 시 유용하지 않을 수도 있습니다.

교차 검증을 통해 선택된 모형이 가장 적합한지 여부를 결정하려면 R2과 예측 R2 값을 조사하십시오. 어떤 경우에는 교차 검증을 통해 선택된 모형이 아닌 모형을 사용하기로 결정할 수도 있습니다. Minitab에서 선택하는 모형에 두 가지 성분을 추가할 때 R2은 상당히 커지고 예측 R2은 약간 작아지는 경우가 있다고 가정하십시오. 이 경우 예측 R2이 약간만 작아지기 때문에 모형은 과대 적합이 아니며 데이터에 더 적합하다고 결정할 수 있습니다.

PRESS

예측 오차 제곱합(PRESS)은 적합치와 관측치 사이 편차의 측도입니다. PRESS는 잔차 제곱의 합인 잔차 오차의 제곱합(SSE)과 유사합니다. 그러나 PRESS는 다른 방법으로 잔차를 계산합니다. PRESS를 계산하기 위해 사용되는 공식은 데이터 집합에서 각 관측치를 체계적으로 제거하고 회귀 방정식을 추정하며 모형이 제거된 관측치를 얼마나 잘 예측하는지 결정하는 절차와 동일합니다.

해석

예측 제곱합(PRESS)을 사용하여 모형의 예측 능력을 평가할 수 있습니다. 일반적으로 예측 제곱합(PRESS) 값이 작을수록 모형의 예측 능력이 좋습니다. Minitab에서는 PRESS를 사용하여 일반적으로 해석하는 데 더 직관적인 예측 R2을 계산합니다. 또한 이 통계량을 사용하면 모형이 과적합되지 않습니다. 모집단에서 중요하지 않은 효과에 대한 항을 추가할 경우 과다 적합 모형이 발생할 수 있습니다. 모형이 표본 데이터에 따라 조정되므로, 모집단에 대해 예측하는 데 유용하지 않을 수도 있습니다.