다음에 대한 대체 모델 선택 최고의 모형 검색(계량형 반응)

예측 분석 모듈 > 자동화된 기계 학습 > 최고의 모형 검색(계량형 반응)을 실행합니다. 결과에서 대체 모델 선택 버튼을 클릭합니다.

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

Minitab 통계 소프트웨어를 사용하여 최상의 모형 유형을 식별하는 경우 분석에 대한 정확도 기준의 최적 값(예: 최대 R²)을 사용하여 최고의 모형 검색(계량형 반응) 모형에 대한 결과를 생성합니다. Minitab에서는 다른 모형 및 다른 유형의 모형에 대한 결과를 탐색할 수 있습니다. 예를 들어 다른 유형의 모형이 유사한 예측 정확도를 생성하는 경우 각 모형 유형에서 동일한 예측 변수가 중요한지 여부를 확인할 수 있습니다.

사용 가능한 옵션은 모델 유형에 따라 다릅니다. 다중 회귀 및 CART^® 모델의 경우 검색에서 최상의 모델에 대한 결과를 조사할 수 있습니다. Random Forests^®, TreeNet^®및 MARS^® 모델의 경우 검색에 있는 모든 모델의 결과를 검사할 수 있습니다. Random Forests^®, TreeNet^® 및 MARS^® 모델의 경우 하이퍼파라미터를 조정하여 검색의 하이퍼파라미터보다 훨씬 더 나은 값을 생성하는 조합을 찾을 수도 있습니다.

Random Forests^®

기존 모델을 선택하여 검색에서 모델 중 하나에 대한 결과를 생성합니다. 새 모델에 맞게 하이퍼파라미터를 지정하여 모델의 성능을 향상시키는 하이퍼파라미터 조합을 찾습니다.

기존 모형 선택

최상의 모델 유형을 찾기 위해 분석은 내부 노드의 최소 크기가 다른 최대 3개의 Random Forests^® 모델을 생성합니다. 목록에서 모델을 선택하고 클릭하여 결과 표시 해당 모델에 대한 결과를 생성합니다.

새 모형에 적합할 하이퍼파라미터 지정

분석하려면 처음 3개의 하이퍼파라미터를 지정해야 합니다. 학습 데이터 크기보다 작은 부트스트랩 샘플 크기를 포함하는 것은 선택 사항입니다. 새 모델에 대한 하이퍼파라미터를 평가하려면 클릭합니다 결과 표시 . 결과에는 하이퍼파라미터의 다양한 조합에 대한 최적성 기준과 모델에 대한 모델 결과를 최대값R²와 같은 최적성 기준의 최적 값과 비교하는 테이블이 포함됩니다.

노드 분할 예측 변수 수: 각 노드 분할에 대해 고려할 예측 변수의 수를 1-3개 지정합니다. 일반적으로 총 예측 변수 수의 제곱근을 고려할 때 분석이 잘 작동합니다. 그러나 일부 데이터 세트에는 분석이 각 노드에서 예측 변수의 다른 임의 하위 집합을 고려할 때 모형 성능이 향상되는 예측 변수 간의 연결이 있습니다.
내부 노드를 분할하는 최소 사례 수: 노드가 가질 수 있는 최소 사례 수를 1-3개 입력하고 여전히 더 많은 노드로 분할합니다. 기본적으로 원래 검색에는 숫자 2, 5 및 8이 포함됩니다.
트리를 키울 부트스트랩 표본 수: 값을 입력하여 부트스트랩 표본 수와 분석에서 생성된 트리 수를 결정합니다. 3에서 3000 사이의 값을 입력합니다.
학습 데이터 크기보다 작은 부트스트랩 표본 크기 지정: 부트스트랩 표본 크기를 설정하는 값을 입력하려면 선택합니다. 5보다 크거나 같은 값을 입력해야 합니다. 학습 데이터 크기보다 큰 크기를 입력하면 Minitab은 학습 데이터 크기와 동일한 표본 크기를 사용합니다.

TreeNet^®

기존 모형 선택

최상의 모델 유형을 찾기 위해 분석은 각 하이퍼파라미터 조합에 대해 TreeNet^® 모델을 생성합니다. 목록에서 모델을 선택하고 클릭하여 결과 표시 해당 모델에 대한 결과를 생성합니다.

새 모형에 적합할 하이퍼파라미터 지정

분석하려면 모든 하이퍼파라미터를 지정해야 합니다. 새 모델에 대한 하이퍼파라미터를 평가하려면 클릭합니다 결과 표시 . 결과에는 하이퍼파라미터의 다양한 조합에 대한 최적성 기준과 모델에 대한 결과를 최대^R2와 같은 분석에 대한 정확도 기준의 최적 값과 비교하는 표가 포함됩니다.

학습 속도

최대 10개의 값을 입력합니다. 적합한 값의 범위는 0.0001에서 1까지입니다.

하위 표본 부분

최대 10개의 값을 입력합니다. 적합한 값은 0보다 크고 1보다 작거나 같습니다.

트리당 최대 터미널 노드 수 및 최대 트리 깊이

트리당 최대 터미널 노드 수 또는 최대 트리 깊이을(를) 평가할지 여부를 선택합니다. 일반적으로 두 가지 선택 모두 유용한 모델을 식별하는 합리적인 방법이므로 선택은 개별 기본 설정에만 의존합니다.

최대 단말 노드: 최대 3개의 값을 입력합니다. 적합한 값은 2에서 2000 사이입니다. 2 값은 교호작용 조사를 제거합니다.
최대 트리 깊이: 최대 3개의 값을 입력합니다. 적합한 값은 트리의 최대 깊이를 나타내는 2에서 1000 사이입니다. 루트 노드는 깊이 1에 해당합니다. 많은 용도에서 4에서 6까지의 깊이는 합리적으로 좋은 모형을 제공합니다.

노드 분할 예측 변수 수

최대 3개의 값을 입력합니다. 적격 값은 1과 총 예측 변수 수 사이입니다. 일반적으로 분석은 예측 변수의 총 수를 고려할 때 잘 작동합니다. 그러나 일부 데이터 세트에는 예측 변수 간에 연관성이 있어 분석에서 각 노드에 대해 더 적은 수의 예측 변수를 고려할 때 모델 성능이 향상됩니다.

트리 수

빌드할 최대 트리 수를 지정하려면 1과 5000 사이의 값을 입력합니다. 기본 값 300은 일반적으로 하이퍼파라미터 값의 평가에 유용한 결과를 제공합니다.

하나 이상의 관심 모형에 지정한 트리 수에 가까운 여러 개의 트리가 있는 경우 트리 수를 늘릴지 여부를 고려합니다. 트리 수가 최대 수에 가까워지면 트리 수가 증가하여 모형의 성능을 향상시킬 가능성이 더 높아집니다.

MARS®

기존 모형 선택

최상의 모형 유형을 찾을 때 분석은 검색의 각 기저 함수 수가 포함된 MARS^® 모형을 생성합니다. 목록에서 모델을 선택하고 클릭하여 결과 표시 해당 모델에 대한 결과를 생성합니다.

새 모형에 적합할 하이퍼모수 지정

새 모델에 대한 매개변수를 평가하려면 클릭합니다 결과 표시 . 결과에는 최대값R²와 같은 최적성 기준의 최적 값을 갖는 모델에 대한 모델 결과가 포함됩니다.

최대 기본 함수 수

기본값 30은 대부분의 경우에 잘 작동합니다. 30개의 기저 함수가 데이터에 비해 너무 작아 보이는 경우 더 큰 값을 고려하십시오. 예를 들어, 30개 이상의 예측 변수가 중요하다고 생각되는 경우 더 큰 값을 고려하십시오.

30이면 충분한지 확실하지 않은 경우 초기 결과를 검토합니다. 예를 들어, 분석에서 기저 함수를 추가함에 따라 R-제곱 값이 위쪽으로 추세를 보이는 경우 값이 클수록 모형의 적합도가 향상될 가능성이 더 높습니다.

매듭 사이의 최소 관측치 수

MARS가® 선택하도록 허용: 분석에서는 표본 크기와 모형 복잡도를 사용하여 값을 자동으로 선택합니다. 자동 값은 대부분의 경우 잘 작동합니다.
사용자 정의 λ: 값 1은 연속 데이터 요소가 기저 함수가 변경되는 점이 될 수 있음을 나타냅니다. 값 1은 모델 예측에서 가장 빠른 변경을 허용합니다. 더 큰 값을 사용하여 더 부드러운 모델을 생성하여 보다 일반적인 관계를 탐색할 수 있습니다. 이러한 부드러운 모델은 때때로 데이터의 특정 범위에서 덜 정확합니다.

허용된 예측 변수 상호 작용

예측자 상호 작용을 지정한 순서까지 허용합니다. 교호작용은 예측 변수의 효과가 다른 예측 변수의 값에 따라 달라진다는 것을 의미합니다. 예를 들어, 오븐에서 곡물이 건조되는 속도는 오븐에서의 시간에 따라 다르지만 시간의 영향은 오븐의 온도에 따라 다릅니다. 시간 변수와 온도 변수가 상호 작용합니다.

교호작용을 허용하지 않음(가산 모형)

예측 변수 교호작용을 허용하지 마십시오. 이 경우 Minitab에서는 기저 함수가 상호 작용하지 않는 가산 모형을 사용합니다.

모든 상호 작용을 최대 순서 2까지 허용

Order는 기저 함수에 포함될 수 있는 여러 예측 변수의 수를 지정합니다. 예를 들어, 차수가 2이면 예측 변수의 효과가 다른 예측 변수 1개의 값에 따라 달라질 수 있다는 것을 나타냅니다. 다음 기본 함수는 차수 2의 교호작용의 예입니다.

BF1 = 최대 (0, X₁ − 800)
BF2 = 최대 (0, X₂ − 50) * BF1

다중 회귀

선택하고 여러 회귀 모형에 대한 결과 클릭하여 결과 표시 최상의 모델 유형을 검색하여 최상의 다중 회귀 모델에 대한 결과를 생성합니다.

CART®

선택하고 CART® 모형의 결과 클릭하여 결과 표시 최상의 모델 유형을 검색하여 최상의 CART^® 모델에 대한 결과를 생성합니다.

다음에 대한 대체 모델 선택 최고의 모형 검색(계량형 반응)

참고

Random Forests®

기존 모형 선택

새 모형에 적합할 하이퍼파라미터 지정

TreeNet®

기존 모형 선택

새 모형에 적합할 하이퍼파라미터 지정

MARS®

기존 모형 선택

새 모형에 적합할 하이퍼모수 지정

다중 회귀

CART®

Random Forests^®

TreeNet^®