이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.
Minitab이 모형 생성에 사용하는 손실 함수입니다. Minitab은 제곱 오차(기본값), 절대 편차 또는 Huber 손실 함수를 사용합니다.
절대 편차 손실 함수는 최소 제곱 오차 손실 함수에 비해 최소를 적합하는 점의 영향을 줄이려고 시도합니다. Huber 손실 함수는 더 작은 절대 잔차에 대한 최소 제곱 오차 손실 함수와 가장 큰 절대 잔차에 대한 최소 절대 편차 손실 함수를 사용하여 다른 두 손실 함수를 절충합니다.
Minitab은 교차 검증 방법을 사용하거나 별도의 검정 세트를 사용하여 모형을 검증합니다. 교차 검증을 사용하면 각 폴드의 행을 지정하거나 임의 선택을 허용할 수 있습니다. 별도의 검정 세트를 사용하면 학습 및 검정 세트에 대한 행을 지정하거나 임의 선택을 허용할 수 있습니다.
낮은 학습률은 모형에 있는 각 새 트리의 가중치가 더 높은 학습률보다 적으며 때로는 모형에 대해 더 많은 트리를 생성합니다. 학습률이 낮은 모형은 학습 데이터 세트에 과다 적합될 확률이 낮습니다.
기본 학습률 = max[0.01, 0.1 * min(1.0, N/10000)입니다. 낮은 학습률을 사용하면 최적의 트리 수가 최대 트리 수보다 적도록 모형의 최대 트리 수를 늘릴 수 있습니다.
하위 표본 분수는 해석이 각 트리를 빌드하는 데 사용하는 데이터를 보여줍니다. 과도 적합이 우려되는 경우 이 매개 변수를 조정합니다.
단말 노드에 대한 최소 사례 수를 나타냅니다. 예를 들어 최소 크기가 3이고 분할이 사례가 3개 미만인 노드를 만드는 경우 Minitab은 분할을 수행하지 않습니다.
이 행은 노드 분할이 각 노드의 모든 예측 변수 또는 예측 변수의 임의 하위 세트를 고려하는지 여부를 나타냅니다. 노드 분할이 임의의 하위 세트를 사용하는 경우 이 행은 고려해야 할 예측 변수 수에 대한 선택을 나타냅니다.
처음에 모든 예측 변수를 사용하는 경우 후속 모형에서 예측 변수의 하위 세트를 사용하여 모형의 성능을 비교할지 여부를 고려합니다.
기본적으로 분석에 누락된 값 페널티가 없으며 이 행이 없습니다. 결측값 페널티는 결측값 비율에 따라 예측 변수에 불이익을 주게 됩니다. 페널티가 높은 변수는 노드의 분할 역할을 할 가능성이 적습니다.
기본적으로 분석에 높은 수준의 범주 페널티가 없으며 이 행은 존재하지 않습니다. 높은 수준 범주 페널티는 각 노드의 노드 크기에 대한 범주 수준 수에 따라 변수에 불이익을 주게 됩니다. 따라서 수준이 많은 경쟁업체는 노드의 분할 역할을 할 가능성이 적습니다.
반응에 가중치를 주기 위해 사용되는 열을 나타냅니다.
모형을 적합하고 평가하는 분석의 반응 관측치 수입니다.
누락된 반응 관측치 수입니다. 여기에는 가중치 열에 결측값 또는 0도 포함됩니다.