교차 검증에서는 모형에 포함된 성분의 수가 적절한지 쉽게 확인할 수 있도록 잠재적 모형의 예측 능력을 계산합니다. 교차 검증은 데이터의 최적 성분 수를 결정하기 위해 사용합니다. 데이터에 반응 변수가 여러 개인 경우 Minitab은 모든 반응값에 대한 성분을 동시에 검증합니다. 자세한 내용은 PLS 회귀 분석의 교차 검증에서 확인하십시오.
Minitab에서는 다음 세 가지 방법으로 교차 검증을 수행할 수 있습니다.
없음: 교차 검증을 수행하지 않습니다.
단일 관측치 제거법: 관측치를 한 번에 하나씩 제거하여 잠재적 모형을 계산하려면 이 옵션을 사용합니다. 큰 데이터 집합의 경우 이 방법을 사용하면 관측치 수만큼 모형을 다시 계산하므로 많은 시간이 소요될 수 있습니다.
그룹 제거법에 대한 그룹 크기: 모형을 재계산할 때마다 제거할 관측치 수를 입력합니다. 이 방법을 사용하면 모형을 재계산해야 하는 횟수가 감소하므로, 데이터 집합이 큰 경우에 가장 적합합니다.
제거할 관측치 지정 열: 그룹 식별자 열에 일치하는 수가 있는 관측치를 동시에 제외하여 모형을 계산하려면 이 옵션을 사용합니다. 이 방법을 사용하면 동시에 제거될 관측치를 지정할 수 있습니다. 예를 들어 그룹 식별자 열에 숫자 1, 2, 3이 있을 경우 1이 표시된 관측치는 모두 함께 제거되고 모형이 재계산됩니다. 다음에는 2가 표시된 모든 관측치가 제거되고 모형이 재계산되는 식입니다.
범주형 예측 변수 코드화 유형
Minitab은 분석을 수행하기 위해 두 가지 방법 중 하나를 사용하여 범주형 예측 변수를 다시 코드화해야 합니다. 예측 변수의 수준을 전체 평균과 비교할지 아니면 기준 수준의 평균과 비교할 지에 따라 방법을 변경하는 방안을 고려하십시오. 자세한 내용은 범주형 예측 변수의 코드화 방법에서 확인하십시오.
(1, 0): 각 수준 평균과 각 기준 수준 평균의 차이를 추정하려면 선택합니다. (1, 0) 코드화 형식을 선택하면 기준 수준을 지정할 수 있습니다.
(-1, 0, +1): 각 수준 평균과 전체 평균의 차이를 추정하려면 선택합니다.
기준 수준(수준 앞에 범주형 예측 변수 입력)
범주형 예측 변수 열과 기준 수준을 차례로 입력하여 기준 수준을 입력합니다. (텍스트 및 날짜/시간 수준은 따옴표로 묶어야 합니다.) 1, 0 코드화를 사용하는 경우에만 기준 수준을 할당할 수 있습니다. Minitab은 기본적으로 데이터 유형에 따라 다음과 같은 기준 수준을 설정합니다.