TreeNet® 회귀 분석를 통한 모형 적합주요 예측 변수 검색에 대한 검증 방법 지정

유효성 검사 옵션은 다음 분석에 대해 동일합니다.

예측 분석 모듈 > TreeNet® 회귀 > 모형 적합 > 검증

예측 분석 모듈 > TreeNet® 회귀 > 주요 예측 변수 검색 > 검증

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

모형을 검정할 검증 방법을 선택합니다. 일반적으로 표본이 작은 경우 K-폴드 교차 검증 방법이 적합합니다. 더 큰 표본을 사용하면 학습 및 검증에 사용할 사례를 선택할 수 있습니다.

K-접기 교차 검증

K-폴드 교차 검증 방법을 사용하여 검정 표본을 검증하려면 다음 단계를 완료합니다. K-폴드 교차 검증 방법은 행 수가 2000 이하일 때 기본 방법입니다.

  1. 드롭다운 리스트에서 K-접기 교차 검증을 선택합니다.
  2. 다음 중 하나를 선택하여 폴드를 임의로 할당할지 또는 ID 열을 사용하여 할당할지 지정합니다.
    • 각 접기의 행 랜덤 할당: Minitab이 각 폴드의 행을 임의로 선택하도록 하려면 이 옵션을 선택합니다. 폴드 수를 지정할 수 있습니다. 모형 적합의 경우 기본값 5는 대부분의 경우에 잘 작동합니다. 주요 예측 변수 검색의 경우 기본 값 3은 계산을 비교적 빠르게 합니다. 두 경우 모두 접기 수가 많을수록 특히 행 수가 적은 데이터 집합의 경우 보다 신뢰할 수 있는 예측 모형을 선택할 가능성이 증가하지만 계산 시간이 크게 늘어날 수 있습니다.
    • ID 열별로 각 접기의 행 할당: 각 폴드에 포함할 행을 선택하려면 이 옵션을 선택합니다. ID 열에서 각 폴드의 행이 포함된 열을 입력합니다.
  3. (선택 사항) ID 열을 저장하려면 K-접기 교차 검증을 위한 ID 열 저장을 선택합니다.

검정 집합을 사용한 검증

학습 및 검정에 사용할 데이터를 지정하려면 다음 단계를 완료합니다. 검정 세트 검증 방법은 행 수가 2000 이상인 경우 기본 방법입니다. 대부분의 경우 데이터의 70%가 학습에 사용되며 데이터의 30%가 검정에 사용됩니다.

  1. 드롭다운 리스트에서 검정 집합을 사용한 검증을 선택합니다.
  2. 다음 중 하나를 선택하여 임의로 행의 일부를 선택할지 또는 ID 열을 사용하여 선택할지 지정합니다.
    • 행 부분을 검정 집합으로 랜덤 선택: Minitab이 검정을 위해 행 부분을 임의로 선택하도록 하려면 이 옵션을 선택합니다. 분수를 지정할 수 있습니다. 기본값 0.3은 대부분의 경우에 잘 작동합니다. 대규모 데이터 세트의 경우 검정에 사용되는 데이터를 늘릴 수 있습니다. 난수 생성기의 기준값을 설정할 수도 있습니다.
    • ID 열별로 교육/검정 분할 정의: 검정 표본에 포함할 행을 선택하려면 이 옵션을 선택합니다. ID 열에서 검정 표본에 사용할 행을 나타내는 열을 입력합니다. ID 열에는 2개의 값만 포함되어야 합니다. 검정 집합 수준에서 검정 표본으로 사용할 수준을 선택합니다.
  3. (선택 사항) ID 열을 저장하려면 교육/검정 분할을 위한 ID 열 저장을 선택합니다.

없음

없음이 선택된 경우 추가 검증은 수행되지 않습니다.