Random Forests® 回帰の相対変数重要度グラフ

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

相対変数重要度グラフは、フォレスト全体で予測変数に分割が行われたときに、モデルの改善に対する予測変数の効果の順に予測変数をプロットします。改善度のスコアが最も高い変数が最も重要な変数とされ、他の変数は重要度の順に設定されます。相対変数重要度は、解釈を容易にするために重要度値が標準化されたものです。相対重要度は、100%の重要度を持つ、最も重要な予測変数に対するパーセント改善度として定義されます。

相対重要度は、各変数重要度スコアを変数の最高の重要度スコアで除算し、100%を乗算して計算されます。

解釈

相対変数重要度値の範囲は0%から100%です。最も重要な変数の相対重要度は、常に100%です。ある変数がモデルでまったく使用されない場合、その変数は重要ではありません。

販売価格を予測するための最も重要な予測変数は品質です。最上の予測変数である品質の重要度が100%の場合、次に重要な変数である居住面積SFは88.8%の寄与度を有します。これは、居住面積が不動産の全体的な品質と88.8%同等の重要度があることを意味します。次に重要な変数は近隣環境で、52.6%の寄与度を有します。