최고의 모형 검색(계량형 반응) 에 대한 검증 방법 지정

예측 분석 모듈 > 자동화된 기계 학습 > 최고의 모형 검색(계량형 반응) > 검증
참고

이 명령은 에서 사용할 수 있습니다 예측 분석 모듈. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

유효성 검사 방법을 선택하여 최상의 모델 유형을 결정합니다. 일반적으로 표본이 작은 경우 K-폴드 교차 검증 방법이 적합합니다. 더 큰 표본을 사용하면 학습 및 검증에 사용할 사례를 선택할 수 있습니다.

Minitab에서 제공하는 선택은 데이터 집합의 크기에 따라 다릅니다. 선택은 하위 대화 상자의 선택과 결합하여 엄격하고 계산 속도의 균형을 맞추는 분석을 제공합니다.
N 1,500
서브디아로그의 유효성 검사 방법은 검증K-접기 교차 검증. 단위 수는 5입니다. 회귀 모형 선택 방법 하위 대화 상자의 단계적 회귀 분석.
1,500 (n - 2,000)
서브디아로그의 유효성 검사 방법은 검증K-접기 교차 검증. 단위 수는 5입니다. 회귀 모형 선택 방법 하위 대화 상자의 검증을 사용한 전진 선택.
2,000, ..., ni
서브디아로그의 유효성 검사 방법은 검증검정 집합을 사용한 검증. 테스트 집합의 데이터 비율은 0.3입니다. 회귀 모형 선택 방법 하위 대화 상자의 검증을 사용한 전진 선택

K-접기 교차 검증.

다음 단계를 완료하여 K-폴드 교차 검증 방법을 사용하여 검정 표본을 검증합니다.

  1. 드롭다운 리스트에서 K-접기 교차 검증 을 선택합니다.
  2. 시차 수 지정 기본값 5은 대부분의 경우에 잘 작동합니다. 두 경우 모두 접기 수가 많을수록 특히 행 수가 적은 데이터 집합의 경우 보다 신뢰할 수 있는 예측 모형을 선택할 가능성이 증가하지만 계산 시간이 크게 늘어날 수 있습니다. 숫자가 많을수록 계산 시간이 크게 늘어을 수 있습니다.
  3. (선택 사항) ID 열을 저장하려면 K-접기 교차 검증을 위한 ID 열 저장 을 선택합니다.

검정 집합을 사용한 검증

다음 단계를 완료하여 학습 및 검정에 사용할 데이터를 지정합니다. 대부분의 경우 데이터의 70%가 학습에 사용되며 데이터의 30%가 검정에 사용됩니다.

  1. 드롭다운 리스트에서 검정 집합을 사용한 검증 을 선택합니다.
  2. 테스트 집합에 대한 데이터의 분수를 지정합니다. 기본값 0.3은 대부분의 경우에 잘 작동합니다. 대규모 데이터 집합의 경우 검정에 사용되는 데이터를 늘릴 수 있습니다. 난수 생성기의 기준값을 설정할 수도 있습니다. 해석의 다른 실행에서 동일한 베이스를 입력하면 테스트 집합에 행 할당이 동일합니다.
  3. (선택 사항) ID 열을 저장하려면 교육/검정 분할을 위한 ID 열 저장 을 선택합니다.