CART® 회귀 분석에 대한 기본 설정 지정

파일 > 옵션 > 예측 분석 > CART® 회귀 분석

회귀 트리에 대한 기본 방법을 지정합니다. 변경된 기본 설정은 Minitab을 종료한 후에도 설정을 다시 변경할 때까지 유지됩니다.

노드 분할 방법
분할 방법을 선택하여 의사 결정 트리를 생성합니다. 두 분할 방법의 결과를 비교하여 용도에 가장 적합한 선택을 결정할 수 있습니다.
  • 최소 제곱 오차: 최소 제곱 오차 방법은 많은 응용 프로그램에서 잘 작동하는 기본 방법입니다. 최소 제곱 오차 방법은 제곱 오차의 합을 최소화합니다.
  • 최소 절대 편차: 최소 절대 편차 방법은 오차 절대값의 합을 최소화합니다.
최적의 트리 선택 기준
최소 제곱 오차이 노드 분할 방법의 기준이면 이 기준 중에서 선택하여 결과에서 트리를 생성합니다. 여러 트리의 결과를 비교하여 용도에 가장 적합한 선택을 결정할 수 있습니다.
최대 R-제곱
최대 결정계수 값을 가진 트리의 결과를 표시하려면 이 옵션을 선택합니다.
최대 R-제곱의 K 표준 오차 이내, K=
Minitab이 최대 R2 결정계수 값을 가진 트리의 K 표준 오차 내에 속하는 R2 결정계수 값을 가진 가장 작은 트리를 선택하도록 하려면 이 옵션을 선택합니다. 기본적으로 K=1이므로, 결과의 트리는 최대 R2 결정계수 값의 1 표준 오차 내의 R2 결정계수 값을 가진 가장 작은 분류 트리입니다.
최소 절대 편차이 노드 분할 방법으로 선택되면 이 기준 중에서 선택하여 결과에서 트리를 생성합니다. 다른 트리의 결과를 비교하여 용도에 가장 적합한 선택을 결정할 수 있습니다.
최소 평균 절대 편차
평균 절대 편차가 가장 적은 트리에 대한 결과를 표시하려면 이 옵션을 선택합니다.
최소 평균 절대 편차의 K 표준 오차 이내, K=
Minitab이 최소 평균 절대 편차 값을 가진 트리의 K 표준 오차 내에 속하는 평균 절대 편차 값을 가진 트리를 선택하도록 하려면 이 옵션을 선택합니다. 기본적으로 K=1이므로, 결과의 트리는 최소 절대 편차 값의 1 표준 오차 이내의 평균 절대 편차 값을 가진 가장 작은 분류 트리입니다.
내부 노드를 분할하는 최소 사례 수
분할할 내부 노드의 최소 사례 수를 나타내는 값을 입력합니다. 기본값은 10입니다. 표본 크기가 클수록 최소값을 늘릴 수 있습니다. 예를 들어 내부 노드에 10개 이상의 사례가 있는 경우 Minitab은 분할을 수행하려고 시도합니다. 내부 노드에 9개 이하의 사례가 있는 경우 Minitab은 분할을 수행하지 않습니다.
내부 노드 제한은 터미널 노드 제한의 두 배 이상이어야 하지만 비율이 클수록 좋습니다. 터미널 노드 제한의 3배 이상인 내부 노드 제한은 적당한 수의 분할을 허용합니다.
기본값은 10입니다.
단말 노드에 허용되는 최소 사례 수
단말 노드로 분리할 수 있는 최소 사례 수를 나타내는 값을 입력합니다. 기본값은 3입니다. 표본 크기가 클수록 최소값을 늘릴 수 있습니다. 예를 들어 분할이 사례가 3개 미만인 노드를 만드는 경우 Minitab은 분할을 수행하지 않습니다.
기본값은 3입니다.
결측값 페널티
결측값이 있는 예측 변수의 패널티 값을 입력합니다. 데이터가 적은 좋은 스플리터가 되기 쉽기 때문에 데이터가 누락된 예측 변수는 데이터를 놓치지 않고 예측 변수보다 우위를 점합니다. 이 옵션을 사용하여 데이터가 누락된 예측 변수에 불이익을 줍니다.
0.0 ≤ K ≤ 2.0, 예:
  • K = 0: 페널티를 지정하지 않습니다.
  • K = 2: 최고 페널티를 지정합니다.
높은 수준 범주 페널티
값이 많은 범주형 예측 변수에 대해 페널티 값을 입력합니다. 수준이 많은 범주형 예측 변수는 분할 누승 증가로 인해 트리를 왜곡할 수 있기 때문에 수준이 적은 예측 변수보다 우위를 점할 수 있습니다. 이 옵션을 사용하여 많은 수준의 예측 변수에 불이익을 줍니다.
0.0 ≤ K ≤ 5.0, 예:
  • K = 0: 페널티를 지정하지 않습니다.
  • K = 5: 최고 페널티를 지정합니다.
그래프 및 표 표시
사용할 잔차
잔차 그림의 상자 그림에 표시할 잔차 유형을 지정합니다.
  • 정규 잔차: 기본적으로 상자 그림에는 일반 잔차가 표시됩니다.
  • 백분율: 상자 그림에 백분율 잔차를 표시하도록 지정합니다.
단말 노드 유형
적합 및 오차 통계 표와 주제 분류 기준 표에 대해 최상의 노드 또는 최악의 노드를 표시할지 둘 다 표시할지 선택합니다.
  • 최량: 기본적으로 Minitab은 최상의 터미널 노드를 표시합니다. 최상의 노드는 MSE 또는 MAD 값이 가장 낮습니다.
  • 최악: 최악의 터미널 노드를 표시하려면 선택합니다. 최악의 노드는 MSE 또는 MAD 값이 가장 높습니다.
  • 최량 및 최악: 선택하여 최상 및 최악의 단말 노드를 표시합니다.