에 대한 유효성 검사 방법을 지정합니다. CART® 분류

예측 분석 모듈 > CART® 분류 > 검증

모형을 검정할 검증 방법을 선택합니다. 일반적으로 표본이 작은 경우 K-폴드 교차 검증 방법이 적합합니다. 더 큰 표본을 사용하면 학습 및 검증에 사용할 사례를 선택할 수 있습니다.

K-접기 교차 검증

다음 단계를 완료하여 K-폴드 교차 검증 방법을 사용하여 검정 표본을 검증합니다. K-폴드 교차 검증 방법은 행 수가 5000 이하일 때 기본 방법입니다.

  1. 드롭다운 목록에서 K-접기 교차 검증을 선택합니다.
  2. 다음 중 하나를 선택하여 폴드를 임의로 할당할지 또는 ID 열을 사용하여 할당할지 지정합니다.
    • 각 접기의 행 랜덤 할당: Minitab이 각 폴드의 행을 임의로 선택하도록 하려면 이 옵션을 선택합니다. 폴드 수를 지정할 수 있습니다. 기본값 10은 대부분의 경우에 잘 작동합니다. K의 낮은 값을 사용하면 더 많은 치우침이 발생할 수 있습니다. 그러나 K값이 클수록 더 많은 가변성이 나타날 수 있습니다. 난수 생성기의 기준값을 설정할 수도 있습니다.
    • ID 열별로 각 접기의 행 할당: 각 폴드에 포함할 행을 선택하려면 이 옵션을 선택합니다. ID 열에서 각 폴드의 행이 포함된 열을 입력합니다.
  3. (선택 사항) ID 열을 저장하려면 K-접기 교차 검증을 위한 ID 열 저장을 선택합니다.

검정 집합을 사용한 검증

다음 단계를 완료하여 학습 및 검정에 사용할 데이터를 지정합니다. 검정 세트 검증 방법은 행 수가 5000 이상인 경우 기본 방법입니다. 대부분의 경우 데이터의 70%가 학습에 사용되며 데이터의 30%가 검정에 사용됩니다.

  1. 드롭다운 목록에서 검정 집합을 사용한 검증을 선택합니다.
  2. 다음 중 하나를 선택하여 임의로 행의 일부를 선택할지 또는 ID 열을 사용하여 선택할지 지정합니다.
    • 행 부분을 검정 집합으로 랜덤 선택: Minitab이 검정을 위해 행 부분을 임의로 선택하도록 하려면 이 옵션을 선택합니다. 분수를 지정할 수 있습니다. 기본값 0.3은 대부분의 경우에 잘 작동합니다. 대규모 데이터 세트의 경우 검정에 사용되는 데이터를 늘릴 수 있습니다. 난수 생성기의 기준값을 설정할 수도 있습니다.
    • ID 열별로 교육/검정 분할 정의: 검정 표본에 포함할 행을 선택하려면 이 옵션을 선택합니다. ID 열에서 검정 표본에 사용할 행을 나타내는 열을 입력합니다. ID 열에는 2개의 값만 포함되어야 합니다. 검정 집합 수준에서 검정 표본으로 사용할 수준을 선택합니다.
  3. (선택 사항) ID 열을 저장하려면 교육/검정 분할을 위한 ID 열 저장을 선택합니다.

없음

없음이 선택된 경우 추가 검증은 수행되지 않습니다.