CART® 회귀 분석에 대한 상대 변수 중요도 차트

상대 변수 중요도 차트를 사용하여 트리에 가장 중요한 변수인 예측 변수를 확인합니다.

상대 변수 중요도는 해석의 용이성을 위해 중요도 값을 표준화합니다. 상대적 중요도는 가장 중요한 예측 변수에 대한 백분율 개선으로 정의됩니다.

중요한 변수는 트리에서 기본 또는 대체 분할로 사용되는 변수입니다. 개선 점수가 가장 높은 변수가 가장 중요한 변수로 설정되고 다른 변수의 순위가 적절하게 매겨집니다. 상대 변수 중요도는 해석의 용이성을 위해 중요도 값을 표준화합니다. 상대적 중요도는 가장 중요한 예측 변수에 대한 백분율 개선으로 정의됩니다.

상대적 중요도는 각 변수 중요도 점수를 변수의 가장 큰 중요도 점수로 나눈 다음 100%를 곱하여 계산합니다.

해석

상대 변수 중요도 값의 범위는 0%에서 100%입니다. 가장 중요한 변수는 항상 100%의 상대적 중요도를 가집니다. 트리에 변수가 전혀 사용되지 않으면 중요하지 않습니다.

이 예제에서 가장 중요한 예측 변수는 알코올 사용입니다. 최상위 예측 변수의 기여도 알코올 사용가 100%인 경우 다른 변수를 알코올 사용와 비교하여 그 중요도를 결정할 수 있습니다. 따라서 가장 중요한 예측 변수에 집중할 수 있습니다. 다음 목록에서는 이 트리에서 다음으로 중요한 변수에 대해 설명합니다.
  • 남용의 1 차적인 물질계획된 약물 치료의 중요도는 알코올 사용와 같이 약 92%입니다.
  • 헤로인 사용의 중요도는 알코올 사용와 같이 약 55%입니다.
  • 하위의 기본 섭취 경로추천 소스의 중요도는 알코올 사용와 같이 약 48%입니다.

이러한 결과에는 긍정적인 중요도를 가진 33개의 변수가 포함되지만 상대 순위는 특정 응용 프로그램을 제어하거나 모니터링할 변수 수에 대한 정보를 제공합니다. 한 변수에서 다음 변수로 상대적 중요도 값이 급격하게 떨어지면 제어하거나 모니터링할 변수에 대한 결정을 내릴 수 있습니다. 예를 들어 이러한 데이터에서 가장 중요한 세 변수에는 다음 변수에 대한 상대적 중요도가 거의 40% 감소하기 전에 비교적 가까워지는 중요도 값이 있습니다. 마찬가지로 세 변수는 50%에 가까운 유사한 중요도 값을 가집니다. 다른 그룹에서 변수를 제거하고 분석을 다시 실행하여 다양한 그룹의 변수가 모형 요약 표의 예측 정확도 값에 미치는 영향을 평가할 수 있습니다.