검증 방법 지정 CART® 분류

통계분석 > 예측 분석 > CART® 분류 > 검증

모형을 검정할 검증 방법을 선택합니다. 일반적으로 표본이 작은 경우 K-폴드 교차 검증 방법이 적합합니다. 더 큰 표본을 사용하면 학습 및 검증에 사용할 사례를 선택할 수 있습니다.

K-접기 교차 검증

다음 단계를 완료하여 K-폴드 교차 검증 방법을 사용하여 검정 표본을 검증합니다. K-폴드 교차 검증 방법은 행 수가 5000 이하일 때 기본 방법입니다.

  1. 드롭다운 목록에서 K-접기 교차 검증을 선택합니다.
  2. 다음 중 하나를 선택하여 폴드를 임의로 할당할지 또는 ID 열을 사용하여 할당할지 지정합니다.
    • 각 접기의 행 랜덤 할당: Minitab이 각 폴드의 행을 임의로 선택하도록 하려면 이 옵션을 선택합니다. 폴드 수를 지정할 수 있습니다. 기본값 10은 대부분의 경우에 잘 작동합니다. K의 낮은 값을 사용하면 더 많은 치우침이 발생할 수 있습니다. 그러나 K값이 클수록 더 많은 가변성이 나타날 수 있습니다. 난수 생성기의 기준값을 설정할 수도 있습니다.
    • ID 열별로 각 접기의 행 할당: 각 폴드에 포함할 행을 선택하려면 이 옵션을 선택합니다. ID 열각 폴드의 행이 포함된 열을 입력합니다.
  3. (선택 사항) K-접기 교차 검증을 위한 ID 열 저장 을 선택하여 ID 열을 저장합니다.

검정 집합을 사용한 검증

다음 단계를 완료하여 학습 및 검정에 사용할 데이터를 지정합니다. 검정 세트 검증 방법은 행 수가 5000 이상인 경우 기본 방법입니다. 대부분의 경우 데이터의 70%가 학습에 사용되며 데이터의 30%가 검정에 사용됩니다.

  1. 드롭다운 목록에서 검정 집합을 사용한 검증을 선택합니다.
  2. 다음 중 하나를 선택하여 임의로 행 부분을 선택할지 또는 ID 열을 사용하여 선택할지 지정합니다.
    • 행 부분을 검정 집합으로 랜덤 선택: Minitab이 검정을 위해 행 부분을 임의로 선택하도록 하려면 이 옵션을 선택합니다. 분수를 지정할 수 있습니다. 기본값 0.3은 대부분의 경우에 잘 작동합니다. 대규모 데이터 세트의 경우 검정에 사용되는 데이터를 늘릴 수 있습니다. 난수 생성기의 기준값을 설정할 수도 있습니다.
    • ID 열별로 교육/검정 분할 정의: 검정 표본에 포함할 행을 선택하려면 이 옵션을 선택합니다. ID 열검정 표본에 사용할 행을 나타내는 열을 입력합니다. ID 열에는 2개의 값만 포함되어야 합니다. 검정 집합 수준검정 표본으로 사용할 수준을 선택합니다.
  3. (선택 사항) 교육/검정 분할을 위한 ID 열 저장 을 선택하여 ID 열을 저장합니다.

없음

없음 이 선택된 경우 추가 검증은 수행되지 않습니다.