Random Forests® 분류 에 대한 데이터 고려 사항

참고

이 명령은 에서 사용할 수 있습니다 예측 분석 모듈. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

결과가 유효한지 확인하려면 데이터를 수집하고 분석을 수행하며 결과를 해석할 때 다음 지침을 고려하십시오.

반응 변수가 이항이어야 함
범주형 변수에는 셀 수 있는 유한의 범주 수 또는 고유 그룹이 포함됩니다. 범주형 데이터는 논리적 순서가 있거나 없을 수도 있습니다. 예를 들어 범주형 변수에는 성별, 재질 유형 및 결제 방법이 포함됩니다.
  • 반응 변수에 합격 및 실패와 같은 두 가지 범주가 있는 경우 반응은 이항입니다.
  • 반응 변수에 세 개 이상의 범주가 포함된 경우 반응은 다항입니다.

반응 변수의 데이터는 텍스트 값 또는 숫자 값이어야 합니다. 날짜/시간 값은 허용되지 않습니다.

반응 변수가 계량형인 경우 Random Forests® 회귀 분석 을 사용합니다.

예측 변수는 계량형이거나 범주형일 수 있습니다.
계량형 또는 범주형 예측 변수의 조합을 사용할 수 있습니다. 그러나 각 예측 변수의 열 길이는 반응 열과 동일한 길이여야 합니다. 결측값은 허용되지 않습니다.
  • 모든 계량형 예측 변수는 숫자여야 합니다.
  • 범주형 예측 변수는 텍스트 또는 숫자 값일 수 있습니다.