TreeNet® 분류를 통한 모형 적합주요 예측 변수 검색에 대한 데이터 고려 사항

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

결과가 유효한지 확인하려면 데이터를 수집하고 분석을 수행하며 결과를 해석할 때 다음 지침을 고려하십시오.

반응 변수가 이항이어야 함
범주형 변수에는 셀 수 있는 유한의 범주 수 또는 고유 그룹이 포함됩니다. 범주형 데이터는 논리적 순서가 있거나 없을 수도 있습니다. 예를 들어 범주형 변수에는 성별, 재질 유형 및 결제 방법이 포함됩니다.
  • 반응 변수에 합격 및 실패와 같은 두 가지 범주가 있는 경우 반응은 이항입니다.
  • 반응 변수에 세 개 이상의 범주가 포함된 경우 반응은 다항입니다.

반응 변수의 데이터는 텍스트 값 또는 숫자 값이어야 합니다. 날짜/시간 값은 허용되지 않습니다.

반응 변수가 계량형인 경우 TreeNet® 회귀 분석에 대해 모형 적합 또는 주요 예측 변수 검색을(를) 사용하십시오.

예측 변수는 계량형이거나 범주형일 수 있습니다.
계량형 또는 범주형 예측 변수의 조합을 사용할 수 있습니다. 그러나 각 예측 변수의 열 길이는 반응 열과 동일한 길이여야 합니다. 결측값은 허용되지 않습니다.
  • 모든 계량형 예측 변수는 숫자여야 합니다.
  • 범주형 예측 변수는 텍스트 또는 숫자 값일 수 있습니다.
사례 수가 2000 이상인 경우 검정 세트가 권장됩니다

기본적으로 Minitab은 사례 수가 2000 이하인 경우 교차 검증을 사용합니다. 사례 수가 2000 이상인 경우 Minitab은 검정 세트를 사용합니다. 일반적으로 교차 검증은 더 나은 검증 방법이지만 결과를 계산하는 데 더 많은 시간이 필요합니다. 검정 집합을 사용하는 검증은 교차 검증 방법에 시간이 너무 오래 걸리는 경우 유용합니다.

모형 적합주요 예측 변수 검색에서 검증 기법에 대한 설정을 자세히 알아보려면 TreeNet® 분류를 통한 모형 적합 및 주요 예측 변수 검색에 대한 검증 방법 지정(으)로 이동하십시오.