최고의 모형 검색(이항 반응) 에서 대체 모형 선택

예측 분석 모듈 > 자동화된 기계 학습 > 최고의 모형 검색(이항 반응)을 실행합니다. 모델 선택 테이블 이후 대체 모형 선택 버튼을 클릭합니다.
참고

이 명령은 에서 사용할 수 있습니다 예측 분석 모듈. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

개요

가장 중요하지 않은 예측 변수를 제거하는 데 을(를) 사용하는 최고의 모형 검색(이항 반응) 경우 Minitab Statistical Software는 최소 평균 로그 우도과 같은 분석에 대한 정확도 기준이 최상의 값을 가진 모형에 대한 결과를 생성합니다. Minitab을 사용하면 다른 모델 및 다른 유형의 모델에 대한 결과를 탐색할 수 있습니다. 예를 들어 다른 유형의 모델이 유사한 예측 정확도를 생성하는 경우 각 모델 유형에서 동일한 예측 변수가 중요한지 여부를 결정할 수 있습니다.

제목 이름은 응용 프로그램의 유형에 따라 다릅니다. CART® 및 이진 로지스틱 회귀 모델의 경우 검색에서 최상의 모델에 대한 결과를 검사할 수 있습니다. 랜덤 포리스트® 및 TreeNet® 모델의 경우 검색의 모든 모델의 결과를 검사할 수 있습니다. 랜덤 포레스트® 및 TreeNet® 모델의 경우 하이퍼파라미터를 조정하여 검색의 하이퍼파라미터보다 더 나은 값을 생성하는 조합을 찾을 수도 있습니다.

Random Forests® 회귀 분석

기존 모델을 선택하여 검색에서 모델 중 하나에 대한 결과를 생성합니다. 모델의 성능을 향상시키는 하이퍼파라미터의 조합을 찾기 위해 새 모델에 맞게 하이퍼매개변수를 지정합니다.

기존 모형 선택

최상의 모델 유형을 검색할 때 분석은 내부 노드에 대해 최소 크기가 다른® 최대 3개의 랜덤 포리스트 모델을 생성합니다. 목록에서 모델을 선택하고 클릭하여 결과 표시 해당 모델에 대한 결과를 생성합니다.

새 모형에 적합할 하이퍼파라미터 지정

해석을 통해 처음 3개의 하이퍼매개변수를 지정해야 합니다. 학습 데이터 크기보다 작은 부트스트랩 표본 크기 지정 클릭하여 결과 표시 새 모델에 대한 하이퍼매개변수를 평가합니다. 결과에는 하이퍼파라미터의 다양한 조합에 대한 최적 기준과 모델의 모델 결과를 최소 평균 –log가능성과 같은 최적 기준값과 비교하는 테이블이 포함됩니다.
노드 분할 예측 변수 수
각 노드 분할에 대해 고려해야 할 예측 변수 수를 지정합니다. 일반적으로 총 예측 변수 수의 제곱근을 고려할 때 분석이 잘 작동합니다. 그러나 일부 데이터 집합에는 분석이 각 노드에 대해 더 크거나 적은 수의 예측 변수를 고려할 때 모형 성능이 향상되는 예측 변수 간에 연결이 있습니다.
내부 노드를 분할하는 최소 사례 수
노드가 가질 수 있고 더 많은 노드로 분할될 수 있는 최소 사례 수를 입력합니다. 기본적으로 원래 검색에는 숫자 2, 5 및 8이 포함됩니다.
트리를 키울 부트스트랩 표본 수
값을 입력하여 부트스트랩 표본 수와 분석에서 생성된 트리 수를 결정합니다. 3에서 3000 사이의 값을 입력합니다.
학습 데이터 크기보다 작은 부트스트랩 표본 크기 지정
부트스트랩 표본 크기를 설정하는 값을 입력하려면 선택합니다. 5보다 크거나 같은 값을 입력해야 합니다. 학습 데이터 크기보다 큰 크기를 입력하면 Minitab은 학습 데이터 크기와 동일한 표본 크기를 사용합니다.

트리넷®

기존 모델을 선택하여 검색에서 모델 중 하나에 대한 결과를 생성합니다. 모델의 성능을 향상시키는 하이퍼파라미터의 조합을 찾기 위해 새 모델에 맞게 하이퍼매개변수를 지정합니다.

기존 모형 선택

최상의 모델 유형을 검색할 때 분석은 각 하이퍼파라미터 조합에 대해 TreeNet® 모델을 생성합니다. 목록에서 모델을 선택하고 클릭하여 결과 표시 해당 모델에 대한 결과를 생성합니다.

새 모형에 적합할 하이퍼파라미터 지정

해석을 하려면 모든 하이퍼매개변수를 지정해야 합니다. 클릭하여 결과 표시 새 모델에 대한 하이퍼매개변수를 평가합니다. 결과에는 하이퍼파라미터의 다양한 조합에 대한 최적 기준과 모델의 결과를 최소 평균 -log가능성과 같은 분석에 대한 정확도 기준의 최상의 값과 비교하는 테이블이 포함됩니다.

학습 속도
최대 10개의 값을 입력합니다. 적합한 값의 범위는 0.0001에서 1까지입니다.
하위 표본 부분
최대 10개의 값을 입력합니다. 적합한 값은 0보다 크고 1보다 작거나 같습니다.
트리당 최대 터미널 노드 수최대 트리 깊이
트리당 최대 터미널 노드 수 또는 최대 트리 깊이 을(를) 평가할지 여부를 선택합니다. 일반적으로 두 선택 중 하나는 유용한 모형을 식별하는 합리적인 방법이며 선택은 개별 기본 설정에만 따라 달라집니다.
최대 단말 노드
최대 3개의 값을 입력합니다. 적합한 값은 2에서 2000 사이입니다. 2 값은 교호작용 조사를 제거합니다.
최대 트리 깊이
최대 3개의 값을 입력합니다. 적합한 값은 트리의 최대 깊이를 나타내는 2에서 1000 사이입니다. 루트 노드는 깊이 1에 해당합니다. 많은 용도에서 4에서 6까지의 깊이는 합리적으로 좋은 모형을 제공합니다.
노드 분할 예측 변수 수
최대 3개의 값을 입력합니다. 적격 값은 예측 변수의 총 수와 1 사이입니다. 일반적으로 총 예측 변수 수의 제곱근을 고려할 때 분석이 잘 작동합니다. 그러나 일부 데이터 집합에는 분석이 각 노드에 대해 더 크거나 적은 수의 예측 변수를 고려할 때 모형 성능이 향상되는 예측 변수 간에 연결이 있습니다.
트리 수
빌드할 최대 트리 수를 지정하려면 1과 5000 사이의 값을 입력합니다. 기본 값 300은 일반적으로 하이퍼파라미터 값의 평가에 유용한 결과를 제공합니다.
하나 이상의 관심 모형에 지정한 트리 수에 가까운 여러 개의 트리가 있는 경우 트리 수를 늘릴지 여부를 고려합니다. 트리 수가 최대 수에 가까워지면 트리 수가 증가하여 모형의 성능을 향상시킬 가능성이 더 높아집니다.

로지스틱 회귀 분석

로지스틱 회귀 모형에 대한 결과결과 표시 선택하고 클릭하여 최상의 모델 유형 검색에서 최상의 이진 로지스틱 회귀 모델에 대한 결과를 생성합니다.

CART®

CART® 모형의 결과 선택하고 최고의 결과 표시 유형의 모델을 검색에서 최상의 CART® 모델에 대한 결과를 생성하려면 클릭합니다.