CART® 분류에 대한 상대 변수 중요도 차트

상대 변수 중요도 차트를 사용하여 분류 트리에 가장 중요한 변수인 예측 변수를 결정합니다.

상대 변수 중요도 그래프는 모형 개선에 미치는 영향 순으로 예측 변수를 표시합니다. 중요한 변수는 트리에서 기본 또는 대체 분할로 사용되는 변수입니다. 개선 점수가 가장 높은 변수가 가장 중요한 변수로 설정되고 다른 변수는 중요도 순에 따라 설정됩니다. 상대 변수 중요도는 해석의 용이성을 위해 중요도 값을 표준화합니다. 상대적 중요도는 가장 중요한 예측 변수(중요도 100%)에 대한 백분율 개선으로 정의됩니다.

상대적 중요도는 각 변수 중요도 점수를 변수의 가장 큰 중요도 점수로 나눈 다음 100%를 곱하여 계산합니다.

해석

상대 변수 중요도 값의 범위는 0%에서 100%입니다. 가장 중요한 변수는 항상 100%의 상대적 중요도를 가집니다. 분류 트리에 변수가 전혀 사용되지 않으면 중요하지 않습니다.

이 예제에서 가장 중요한 예측 변수는 흉통 유형입니다. 상위 예측 변수인 흉통 유형의 기여도를 100%로 계산하면 다음으로 중요한 변수인 주요 출혈의 기여도는 86.5%입니다. 이것은 주요 출혈이 선택한 분류 트리에서 흉통 유형만큼 중요한 86.5%임을 의미합니다.