Random Forests® 분류의 향상도 차트에 대한 방법 및 공식

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

향상도 차트의 점에 대한 절차는 검증 방법에 따라 다릅니다. 다항 반응 변수의 경우 Minitab은 각 클래스를 차례로 사건으로 처리하는 여러 차트를 표시합니다.

OOB

포리스트에 있는 지정된 트리의 경우, OOB 데이터의 행에 대한 클래스 투표는 단일 트리의 행에 대한 예측 클래스입니다. OOB 데이터에서 열에 대한 예측 클래스는 포리스트의 모든 트리에서 가장 높은 투표를 가진 클래스입니다. OOB 데이터에서 행에 대한 예측 클래스 확률은 클래스의 투표 수와 행의 총 투표 비율입니다.

OOB 데이터 집합에 대한 차트의 경우 차트의 각 점은 고유한 예측 클래스 확률을 나타냅니다. 가장 높은 사건 확률은 차트의 첫 번째 점이며 가장 왼쪽에 나타납니다. 다른 확률은 감소 순서로 되어 있습니다.

비누적 향상도 차트의 점은 ROC 곡선 차트의 점 계산에서 따르지 않습니다. 대신, 비누적 향상도 차트의 y-좌표는 (x-좌표에서 인구의 백분율/%의 비누적 진양성률)입니다. 진양성률의 계산은 ROC 곡선 차트와 정확히 동일합니다.

차트의 x-좌표의 형식은 다음과 같습니다.

설명 은(는) 적합된 확률이 분계점보다 크고 N이 총 행 수인 행 수입니다. 통계량에 대한 자세한 내용은 Random Forests® 분류을 위한 수신자 검사 특성(ROC) 곡선 차트에 대한 방법 및 수식(으)로 이동하십시오.

별도의 검정 집합

학습 집합 사례와 동일한 단계를 사용하지만 학습 검정 집합의 사례에서 사건 확률을 계산합니다.