CART® 회귀 분석 에 대한 분석 옵션 선택

통계분석 > 예측 분석 > CART® 회귀 > 옵션

분석 옵션을 선택합니다.

노드 분할 방법
분할 방법을 선택하여 의사 결정 트리를 생성합니다. 두 분할 방법의 결과를 비교하여 용도에 가장 적합한 선택을 결정할 수 있습니다.
  • 최소 제곱 오차: 최소 제곱 오차 방법은 많은 응용 프로그램에서 잘 작동하는 기본 방법입니다. 최소 제곱 오차 방법은 제곱 오차의 합을 최소화합니다.
  • 최소 절대 편차: 최소 절대 편차 방법은 오차 절대값의 합을 최소화합니다.
최적의 트리 선택 기준
최소 제곱 오차이 노드 분할 방법의 기준이면 이 기준 중에서 선택하여 결과에서 트리를 생성합니다. 여러 트리의 결과를 비교하여 용도에 가장 적합한 선택을 결정할 수 있습니다.
최대 R-제곱
최대 결정계수 값을 가진 트리의 결과를 표시하려면 이 옵션을 선택합니다.
최대 R-제곱의 K 표준 오차 이내, K=
Minitab이 최대 R2 결정계수 값을 가진 트리의 K 표준 오차 내에 속하는 R2 결정계수 값을 가진 가장 작은 트리를 선택하도록 하려면 이 옵션을 선택합니다. 기본적으로 K=1이므로, 결과의 트리는 최대 R2 결정계수 값의 1 표준 오차 내의 R2 결정계수 값을 가진 가장 작은 분류 트리입니다.
최소 절대 편차이 노드 분할 방법으로 선택되면 이 기준 중에서 선택하여 결과에서 트리를 생성합니다. 다른 트리의 결과를 비교하여 용도에 가장 적합한 선택을 결정할 수 있습니다.
최소 평균 절대 편차
평균 절대 편차가 가장 적은 트리에 대한 결과를 표시하려면 이 옵션을 선택합니다.
최소 평균 절대 편차의 K 표준 오차 이내, K=
Minitab이 최소 평균 절대 편차 값을 가진 트리의 K 표준 오차 내에 속하는 평균 절대 편차 값을 가진 트리를 선택하도록 하려면 이 옵션을 선택합니다. 기본적으로 K=1이므로, 결과의 트리는 최소 절대 편차 값의 1 표준 오차 이내의 평균 절대 편차 값을 가진 가장 작은 분류 트리입니다.
결측값이 있는 예측 변수의 대체 수
예측 변수에 결측값이 있을 때 Minitab에서 검색하는 대체 수를 입력합니다. 많은 예측 변수에 결측값 패턴이 있는 경우 대체 수를 늘려야 합니다.
이 숫자는 검색하는 최대 대체 수를 나타내지만, 이 대체 수는 실제로 찾을 수 없습니다.
기본값은 10입니다.
내부 노드를 분할하는 최소 사례 수
분할할 내부 노드의 최소 사례 수를 나타내는 값을 입력합니다. 기본값은 10입니다. 표본 크기가 클수록 최소값을 늘릴 수 있습니다. 예를 들어 내부 노드에 10개 이상의 사례가 있는 경우 Minitab은 분할을 수행하려고 시도합니다. 내부 노드에 9개 이하의 사례가 있는 경우 Minitab은 분할을 수행하지 않습니다.
내부 노드 제한은 터미널 노드 제한의 두 배 이상이어야 하지만 비율이 클수록 좋습니다. 터미널 노드 제한의 3배 이상인 내부 노드 제한은 적당한 수의 분할을 허용합니다.
단말 노드에 허용되는 최소 사례 수
터미널 노드로 분리할 수 있는 최소 사례 수를 나타내는 값을 입력합니다. 기본값은 3입니다. 표본 크기가 클수록 최소값을 늘릴 수 있습니다. 예를 들어 분할이 사례가 3개 미만인 노드를 만드는 경우 Minitab은 분할을 수행하지 않습니다.
최대 트리 깊이
트리의 최대 깊이를 나타내는 값을 입력합니다. 루트 노드는 깊이 1에 해당합니다. 최상의 트리를 얻으려면 처리 속도가 느려질 수 있지만 더 깊은 트리를 허용해야 합니다.
가중치
사례 가중치가 포함된 열을 입력합니다. 열의 행 수는 반응 열의 행 수와 같아야 합니다. 값은 0 이상이어야 합니다. Minitab은 분석에서 결측값 또는 0을 포함하는 행을 생략합니다.