CART® 분류에 대한 최량 및 최악 단말 노드의 분류 효과

분류 효과 통계를 사용하여 성능 때문에 특별한 관심 노드를 특성화합니다.

Minitab은 각 반응 수준에 대한 표를 표시합니다. 표의 각 행은 노드의 요약을 표시합니다. 이항 사례와 다항 함수 사례 모두 Minitab은 Abs 식(사건 확률 – 0.5)을 사용하여 등급 확률을 정렬합니다. 값이 클수록 단말 노드가 더 적합합니다. 최량 노드는 최량부터 최악까지 순서대로 정렬됩니다. 최악 노드는 최악부터 최량까지 순서대로 정렬됩니다.

등급 확률을 사용할 때 관계가 있는 경우 Minitab은 N의 비율(%)을 두 번째 정렬로 사용합니다. N의 비율(%)이 가장 높은 단말 노드가 첫 번째입니다. 이 정렬 후에도 여전히 동점이 있는 경우 Minitab은 "최량", "최악" 및 "최량 및 최악" 시나리오에서 가장 작은 단말 노드를 먼저 표시합니다.
참고

"최악의" 노드 순서에서도 타이 브레이커가 가장 큰 N의 비율(%)을 먼저 표시하므로 "최량"과 "최악" 순서가 항상 서로 반대되는 것은 아닙니다.

검정 데이터 세트를 사용하는 경우 Minitab은 학습 및 검정 데이터에 대한 별도의 통계를 계산합니다. 통계를 비교하여 학습 데이터와 새 데이터에 대한 트리의 상대적 성능을 검사할 수 있습니다. 검정 통계는 일반적으로 트리가 새 데이터에 대해 수행하는 방법을 더 잘 측정합니다. 학습 및 검정에 대한 단말 노드는 각 단말 노드의 사건 확률에 따라 별도로 순위가 매겨집니다. 검정 데이터에 대한 관측치가 없는 단말 노드에는 사건 확률이 없으므로 이러한 노드는 고려되지 않습니다.

단말 노드
단말 노드를 식별합니다.
사건 카운트 또는 등급 카운트
카운트는 사건이나 비사건 또는 등급에 대한 노드의 사례 수입니다. 분석에 가중치가 포함된 경우 카운트는 가중 카운트입니다. 이러한 노드는 더 일반적인 사례를 나타내기 때문에 많은 사례의 단말 노드가 특별한 관심 영역일 수 있습니다.
전체 카운트
전체 카운트는 사건 및 비사건 사례의 총합 또는 모든 등급 카운트의 합계입니다.
N의 비율(%)
노드에 있는 데이터의 백분율입니다.
사건 확률 또는 등급 확률
사건 확률은 이항 반응 변수에 대한 것이고 등급 확률은 다항 반응 변수에 대한 것입니다.
비사건 확률 또는 비등급 확률
비사건 확률은 이항 반응 변수에 대한 것이고 비등급 확률은 다항 반응 변수에 대한 것입니다.
승산
승산은 비사건에 대한 사건 확률 또는 비등급에 대한 등급 확률의 비율을 나타냅니다.