Random Forests® 회귀 분석에 대한 상대 변수 중요도 차트

참고

이 명령은 예측 분석 모듈에서 사용할 수 있습니다. 모듈을 활성화하는 방법에 대한 자세한 내용은 여기를 클릭하십시오.

상대 변수 중요도 그래프는 트리 시퀀스에 대한 예측 변수가 분할될 때 모형 개선에 미치는 영향 순으로 예측 변수를 표시합니다. 개선 점수가 가장 높은 변수가 가장 중요한 변수로 설정되고 다른 변수는 중요도 순에 따라 설정됩니다. 상대 변수 중요도는 해석의 용이성을 위해 중요도 값을 표준화합니다. 상대적 중요도는 가장 중요한 예측 변수(중요도 100%)에 대한 백분율 개선으로 정의됩니다.

상대적 중요도는 각 변수 중요도 점수를 변수의 가장 큰 중요도 점수로 나눈 다음 100%를 곱하여 계산합니다.

해석

상대 변수 중요도 값의 범위는 0%에서 100%입니다. 가장 중요한 변수는 항상 100%의 상대적 중요도를 가집니다. 모형에 변수가 전혀 사용되지 않으면 중요하지 않습니다.

판매가를 예측하기 위한 가장 중요한 예측 변수는 품질입니다. 상위 예측 변수의 중요도가 100%인 경우 다음으로 중요한 변수인 거실 면적 SF의 기여도는 88.8%입니다. 즉, 거실의 평방피트는 자산의 전체 품질만큼 중요한 88.8%입니다. 다음으로 가장 중요한 변수는 기여도가 52.6%인 이웃입니다.