데이터 고려 사항 CART® 분류

결과가 유효한지 확인하려면 데이터를 수집하고 분석을 수행하며 결과를 해석할 때 다음 지침을 고려하십시오.

반응 변수(대상)는 범주형이어야 합니다.
범주형 변수에는 셀 수 있는 유한의 범주 수 또는 고유 그룹이 포함됩니다. 범주형 데이터는 논리적 순서가 있거나 없을 수도 있습니다. 예를 들어 범주형 변수에는 성별, 재질 유형 및 결제 방법이 포함됩니다.
  • 반응 변수에 합격 및 실패와 같은 두 가지 범주가 있는 경우 반응은 이항입니다.
  • 반응 변수에 세 개 이상의 범주가 포함된 경우 반응은 다항입니다.

반응 변수의 데이터는 텍스트 값 또는 숫자 값이어야 합니다. 날짜/시간 값은 허용되지 않습니다.

반응 변수가 계량형인 경우 CART® 회귀 분석을 사용합니다.

예측 변수는 계량형이거나 범주형일 수 있습니다.
계량형 또는 범주형 예측 변수의 조합을 사용할 수 있습니다. 그러나 각 예측 변수의 열 길이는 반응 열과 동일한 길이여야 합니다. 결측값은 허용되지 않습니다.
  • 모든 계량형 예측 변수는 숫자여야 합니다.
  • 범주형 예측 변수는 텍스트 또는 숫자 값일 수 있습니다.
사례 수가 5000 이상인 경우 검정 세트가 권장됩니다

기본적으로 Minitab은 사례 수가 5000 이하인 경우 교차 검증을 사용합니다. 사례 수가 5000 이상인 경우 Minitab은 검정 세트를 사용합니다. 학습 데이터 세트와 데이터 테스트 세트를 사용하여 검증을 사용하면 데이터 집합이 클 때 유용합니다. CART® 분류에서 검증 기술 설정에 대해 자세히 알아보려면 검증 방법 지정 CART® 분류(으)로 이동하십시오.