CART® 분류에 대한 분석 옵션 선택

통계분석 > 예측 분석 > CART® 분류 > 옵션

분석 옵션을 선택합니다.

노드 분할 방법
분할 방법을 선택하여 의사 결정 트리를 생성합니다. 여러 분할 방법의 결과를 비교하여 용도에 가장 적합한 선택을 결정할 수 있습니다.
  • 지니: 지니 방법이 기본 방법입니다. 지니 방법은 많은 용도에서 잘 작동합니다. 지니 방법은 일반적으로 관심 반응의 높은 농도와 작은 노드를 포함하는 트리를 생성합니다.
  • 엔트로피: 엔트로피 방법은 노드에 대한 특정 우도 함수의 최대값에 비례합니다.
  • 투잉: 투잉 방법은 다항 반응에서만 사용할 수 있습니다. 투잉 방법은 일반적으로 지니 또는 엔트로피 방법보다 균형 잡힌 분할을 생성합니다. 이항 반응의 경우 투잉 방법은 지니 방법과 동일합니다.
  • 등급 확률: 확률 트리는 지니 트리보다 큰 경향이 있습니다. 몇 가지 상위 노드의 성능에 관심이 있을 때 확률 방법을 사용합니다.
최적의 트리 선택 기준
다음 기준 중에서 선택하여 결과에서 트리를 선택합니다. 다른 트리의 결과를 비교하여 용도에 가장 적합한 선택을 결정할 수 있습니다.
  • 최소 오분류 비용: 오분류 비용을 최소화하는 트리에 대한 결과를 표시하려면 이 옵션을 선택합니다.
  • 최소 오분류 비용의 K 표준 오차 이내; K=: 최소 오분류 비용의 K 표준 오차 내에서 오분류 비용이 있는 가장 작은 트리에 대한 결과를 표시하려면 이 옵션을 선택합니다. 기본적으로 K=1이므로 결과는 최소 오분류 비용이 있는 트리의 1 표준 오차 이내의 오분류 비용이 있는 가장 작은 트리에 대한 결과입니다.
결측값이 있는 예측 변수의 대체 수
예측 변수에 결측값이 있을 때 Minitab에서 검색하는 대체 수를 입력합니다. 많은 예측 변수에 결측값 패턴이 있는 경우 대체 수를 늘려야 합니다.
이 숫자는 Minitab에서 검색하는 최대 대체 수를 나타내지만, 이 대체 수는 실제로 찾을 수 없습니다.
기본값은 10입니다.
내부 노드를 분할하는 최소 사례 수
노드가 가질 수 있고 더 많은 노드로 분할될 수 있는 최소 사례 수를 입력합니다. 기본값은 10입니다. 표본 크기가 클수록 최소값을 늘릴 수 있습니다. 예를 들어 내부 노드에 10개 이상의 사례가 있는 경우 Minitab은 분할을 수행하려고 시도합니다. 내부 노드에 9개 이하의 사례가 있는 경우 Minitab은 분할을 수행하지 않습니다.
내부 노드 제한은 터미널 노드 제한의 두 배 이상이어야 하지만 비율이 클수록 좋습니다. 터미널 노드 제한의 3배 이상인 내부 노드 제한은 적당한 수의 분할을 허용합니다.
단말 노드에 허용되는 최소 사례 수
터미널 노드에 있을 수 있는 최소 사례 수를 입력합니다. 기본값은 3입니다. 표본 크기가 클수록 최소값을 늘릴 수 있습니다. 예를 들어 분할이 사례가 3개 미만인 노드를 만드는 경우 Minitab은 분할을 수행하지 않습니다.
최대 트리 깊이
트리의 최대 깊이를 나타내는 값을 입력합니다. 루트 노드는 깊이 1에 해당합니다. 최상의 트리를 얻으려면 처리 속도가 느려질 수 있지만 더 깊은 트리를 허용해야 합니다.
가중치
사례 가중치가 포함된 열을 입력합니다. 열의 행 수는 반응 열의 행 수와 같아야 합니다. 값은 0 이상이어야 합니다. Minitab은 분석에서 결측값 또는 0을 포함하는 행을 생략합니다.