CART® 회귀 분석에 대한 데이터 고려 사항

결과가 유효한지 확인하려면 데이터를 수집하고 분석을 수행하며 결과를 해석할 때 다음 지침을 고려하십시오.

반응 변수(대상)는 계량이어야 합니다.
계량형 변수는 측정 및 정렬할 수 있으며 두 값 사이에 무한한 수의 값이 있습니다. 예를 들어 타이어 샘플의 직경은 계량형 변수입니다.

반응 변수의 데이터는 숫자 값이어야 합니다.

반응 변수가 범주형인 경우 CART® 분류을 사용합니다.

예측 변수는 계량형이거나 범주형일 수 있습니다.
계량형 또는 범주형 예측 변수의 조합을 사용할 수 있습니다. 그러나 각 예측 변수의 열 길이는 반응 열과 동일한 길이여야 합니다. 결측값은 허용되지 않습니다.
  • 모든 계량형 예측 변수는 숫자여야 합니다.
  • 범주형 예측 변수는 텍스트 또는 숫자 값일 수 있습니다.
사례 수가 5000 이상인 경우 검정 세트가 권장됩니다

기본적으로 Minitab은 사례 수가 5000 이하인 경우 교차 검증을 사용합니다. 사례 수가 5000 이상인 경우 Minitab은 검정 세트를 사용합니다. 학습 데이터 세트와 데이터 테스트 세트를 사용하여 검증을 사용하면 데이터 집합이 클 때 유용합니다. CART® 회귀 분석에서 검증 기술 설정에 대해 자세히 알아보려면 CART® 회귀 분석에 대한 검증 방법 지정(으)로 이동하십시오.