이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.
Random Forests® 모형에 사용할 수 있는 총 예측 변수 수입니다. 합계는 지정한 계량형 및 범주형 예측 변수의 합계입니다.
Random Forests® 모형의 중요한 예측 변수 수입니다. 중요 예측 변수는 0보다 중요도 점수가 높습니다. 상대 변수 중요도 차트를 사용하여 상대 변수 중요도의 순서를 표시할 수 있습니다. 예를 들어 20개의 예측 변수 중 10개가 모형에서 중요하다고 가정하면 상대 변수 중요도 차트는 변수를 중요도 순서대로 표시합니다.
Minitab은 반응이 이항일 때 음수 로그 우도의 평균을 계산합니다. 다른 모형에 대한 평균 로그 우도 값을 비교하여 가장 적합한 모형을 결정합니다. 이 통계를 사용하여 CART® 분류 및 TreeNet® 분류 등 다른 명령의 모형을 비교할 수도 있습니다. 평균 로그 우도 값이 낮을수록 더 적합함을 나타냅니다.
ROC 곡선은 y축에 검정력이라고도 하는 진양성률(TPR)을 플로팅합니다. ROC 곡선은 x축에서 유형 1 오차라고도 하는 가양성률(FPR)을 표시합니다. ROC 곡선 아래 면적은 분류 트리가 올바른 분류자인지 여부를 나타냅니다.
분류 트리의 경우 ROC 곡선 아래 면적 값 범위는 0.5에서 1 사이입니다. 값이 클수록 더 좋은 분류 모형을 나타냅니다. 이항 모형이 등급을 완벽하게 구분할 수 있는 경우 곡선 아래 면적은 1입니다. 이항 모형이 임의 할당보다 등급을 더 잘 구분할 수 없는 경우 곡선 아래 면적은 0.5입니다.
반응이 이항일 때 Minitab은 향상도를 표시합니다. 향상도는 올바른 분류의 가장 좋은 기회와 데이터의 10%에 대한 누적 향상도입니다.
향상도는 평균 반응으로 나눈 대상 반응의 비율을 나타냅니다. 향상도가 1보다 크면 데이터 세그먼트가 예상 반응보다 큽니다.
오분류 비율은 모형이 사건 및 비사건을 정확하게 분류하는 빈도를 나타냅니다. 값이 작을수록 더 좋은 성능을 나타냅니다.