Random Forests® 분류에 대한 검증 방법 지정

예측 분석 모듈 > Random Forests® 분류 > 검증
참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

OOB 검증 외에도 검정 데이터 집합로 검증할지 여부를 선택합니다.

OOB 데이터를 사용한 검증

Random Forests® 분류에서 모든 트리에 부트스트랩 표본 추출을 사용합니다. 부트스트랩 표본의 모든 레코드는 원래 데이터 집합을 대체하여 무작위로 선택됩니다. 원래 데이터 집합의 전체 관측치 중 일부 레코드는 모든 부트스트랩 표본에서 제외됩니다. 부트스트랩 표본에서 제외된 행은 OOB 데이터 집합을 만듭니다.

OOB 데이터 외에 검정 집합을 사용한 검증

다음 단계를 완료하여 학습 및 검정에 사용할 데이터를 지정합니다. OOB 데이터 외에 검정 집합을 사용한 검증을 선택하면 기본적으로 Minitab은 데이터의 30%를 검정에 사용합니다.

  1. 드롭다운 리스트에서 OOB 데이터 외에 검정 집합을 사용한 검증을 선택합니다.
  2. 다음 중 하나를 선택하여 임의로 행의 일부를 선택할지 또는 ID 열을 사용하여 선택할지 지정합니다.
    • 행 부분을 검정 집합으로 랜덤 선택: Minitab이 검정을 위해 행 부분을 임의로 선택하도록 하려면 이 옵션을 선택합니다. 분수를 지정할 수 있습니다. 기본값 0.3은 대부분의 경우에 잘 작동합니다. 대규모 데이터 집합의 경우 검정에 사용되는 데이터를 늘릴 수 있습니다. 난수 생성기의 기준값을 설정할 수도 있습니다.
    • ID 열별로 교육/검정 분할 정의: 검정 표본에 포함할 행을 선택하려면 이 옵션을 선택합니다. ID 열에서 검정 표본에 사용할 행을 나타내는 열을 입력합니다. ID 열에는 2개의 값만 포함되어야 합니다. 검정 집합 수준에서 검정 표본으로 사용할 수준을 선택합니다.
  3. (선택 사항) ID 열을 저장하려면 교육/검정 분할을 위한 ID 열 저장을 선택합니다.