교차 검증의 정의

교차 검증에서는 모형에 적절한 성분 수가 포함되어 있는지 여부를 쉽게 확인할 수 있도록 잠재적 모형의 예측 능력을 계산합니다. 최적의 성분 수를 모르는 경우 교차 검증이 가장 적합합니다. 데이터에 반응 변수가 여러 개인 경우 Minitab은 모든 반응 변수에 대한 성분을 동시에 검증합니다.

교차 검증 방법

Minitab에서는 교차 검증을 위해 다음과 같은 세 가지 방법을 수행할 수 있습니다.
단일 관측치 제거법
한 번에 하나씩 관측치를 제외하여 잠재적 모형을 계산합니다. 큰 데이터 집합의 경우 이 방법을 사용하면 관측치 수만큼 모형을 다시 계산하므로 많은 시간이 걸릴 수 있습니다.
그룹 제거법에 대한 그룹 크기
모형을 재계산하는 횟수를 줄이기 위해 동시에 여러 개의 관측치를 제외하여 모형을 계산합니다. 큰 데이터 집합에는 이 방법을 사용하는 것이 가장 좋습니다.
제거할 관측치 지정 열
워크시트에 만든 그룹 식별자 열의 숫자와 유사한 관측치를 동시에 제외하여 모형을 계산합니다. 이 방법을 사용할 때는 동시에 제거될 관측치를 지정할 수 있습니다. 예를 들어 그룹 식별자 열에 숫자 1, 2, 3이 있을 경우 1이 표시된 관측치는 모두 함께 제거되고 모형이 재계산됩니다. 다음에는 2가 표시된 모든 관측치가 제거되고 모형이 재계산되는 식입니다. 이 경우 모형이 재계산되는 횟수는 모두 3번입니다. 그룹 식별자 열은 반응 및 예측 변수 열의 길이와 같아야 하며 결측값을 포함할 수 없습니다.

교차 검증 절차

Minitab은 가능한 각 모형에 대해 다음 작업을 수행합니다.
  1. 교차 검증 방법에 따라 관측치 한 개나 관측치 그룹을 제외합니다.
  2. 관측치 한 개 또는 관측치 그룹이 제외된 모형을 재계산합니다.
  3. 재계산된 모형을 사용하여 제외된 관측치/관측치 그룹의 반응값이나 교차 검증된 적합치를 예측하고 교차 검증된 잔차 값을 계산합니다.
  4. 모든 관측치가 제외되고 적합될 때까지 1 - 3단계를 반복합니다.
  5. 예측 제곱합(PRESS)과 예측 R2 값을 계산합니다.

Minitab은 각 모형에 대해 1 - 5단계를 수행한 후 예측 R2이 가장 크고 PRESS가 가장 작게 생성되는 성분 수를 가진 모형을 선택합니다. 반응 변수가 여러 개인 경우 Minitab은 예측 R2의 평균이 가장 크고 PRESS의 평균이 가장 작은 모형을 선택합니다.

교차 검증을 사용하지 않는 경우 Minitab에서는 성분 수를 10 또는 모형의 예측 변수 수 중에서 작은 값으로 설정합니다.

교차 검증 통계량

교차 검증을 수행하는 경우 Minitab에서는 다음 통계량이 포함된 추가 요약 표를 표시합니다.
교차 검증된 적합치

부분 최소 제곱법에서 교차 검증된 적합치는 데이터 집합의 각 관측치에 대해 개별적으로 계산되는 예측 반응값이므로, 해당 관측치에 대한 예측 반응값을 계산하는 데 사용된 관측치는 모형에서 제외될 수 있습니다. 교차 검증된 적합치는 교차 검증을 수행하는 중에 계산되며, 모형이 재계산될 때마다 제외되는 관측치 수에 따라 달라집니다.

교차 검증된 적합치를 사용하여 모형이 데이터를 얼마나 잘 적합하는지 식별할 수 있습니다. 교차 검증된 적합치는 모형이 데이터에 적합한 정도를 나타내는 범용 적합치와 비슷합니다.

교차 검증된 잔차

부분 최소 제곱법에서 교차 검증된 잔차는 실제 반응값과 교차 검증된 적합치의 차이입니다. 교차 검증된 잔차 값은 교차 검증을 수행하는 중에 모형이 재계산될 때마다 제외되는 관측치 수에 따라 달라집니다.

잔차는 모형의 예측 능력을 측정합니다. Minitab에서는 교차 검증된 잔차를 사용하여 PRESS 통계량을 계산합니다.