TreeNet® 분류를 통한 모형 적합주요 예측 변수 검색에 대한 ROC 곡선 아래 영역 대 트리 수 그림

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

ROC 곡선 아래 영역 대 트리 수 그림은 y축의 ROC 곡선 아래 영역과 x축의 트리 수를 표시합니다. ROC 곡선 아래 면적은 모형이 올바른 분류자인지 여부를 나타냅니다. 검정 결과를 사용하여 새 관측치를 예측하기 위해 모형의 성능을 평가합니다. 학습 결과와 검정 결과를 비교하여 학습 데이터 집합의 모형에 과대 적합 문제가 있는지 확인합니다.

최대우도 값이 최적 모형의 트리 수를 결정하면 Minitab에는 평균 로그 우도 대 트리 수 그림이 표시됩니다. 최소 오분류 비율이 최적 모형의 트리 수를 결정하면 Minitab에는 오분류 비율 대 트리 수 그림이 표시됩니다.

해석

분류 트리의 경우 ROC 곡선 아래 면적 값 범위는 0.5에서 1 사이입니다. 값이 클수록 더 좋은 분류 모형을 나타냅니다. 이항 모형이 등급을 완벽하게 구분할 수 있는 경우 곡선 아래 면적은 1입니다. 이항 모형이 임의 할당보다 등급을 더 잘 구분할 수 없는 경우 곡선 아래 면적은 0.5입니다.

기준선은 검정 데이터에 대한 ROC 곡선 아래의 최적 영역과 모형의 트리 수를 나타냅니다.

이상적으로는 트리 수가 증가함에 따라 검정 곡선이 증가한 후 경우에 따라 평준화 또는 감소하기 전에 최대값에 도달합니다. 검정 곡선의 최대값이 이상적이지 않은 경우 학습 속도와 하위 표본 분수를 조정하여 비교해 보십시오.