相対変数重要度グラフ CART® 回帰

相対変数重要度グラフを使用して、木にとって最も重要な変数である予測変数を確認します。

相対変数重要度は解釈を容易にするために重要度値が標準化されたものです。相対重要度は、最も重要な予測変数に対するパーセント改善度として定義されます。

重要な変数とは、木で最良の分岐変数または代理変数として使用される変数です。改善度のスコアが最も高い変数が最も重要な変数とされ、他の変数もそれに応じてランク付けされます。相対変数重要度は解釈を容易にするために重要度値を標準化したものです。相対重要度は、最も重要な予測変数に対するパーセント改善度として定義されます。

相対重要度は、各変数重要度スコアを変数の最高の重要度スコアで除算し、100%を乗算して計算されます。

解釈

相対変数重要度値の範囲は0%から100%です。最も重要な変数の相対重要度は、常に100%です。ある変数が木でまったく使用されない場合、その変数は重要ではありません。

この例では、最も重要な予測変数は アルコール使用です。最上の予測変数 アルコール使用の寄与度が100%の場合、他の変数を アルコール使用と比較してその重要性を判断することができます。したがって、最も重要な予測変数に着目することができます。次のリストは、この木の、次に重要な変数を示しています。
  • 乱用の主な物質 および 計画された薬物療法アルコール使用の約92%重要です。
  • ヘロイン使用アルコール使用の約55%重要です。
  • サブの一次摂取ルート および 紹介ソースアルコール使用の約48%重要です。

これらの結果には、確かに重要な33個の変数が含まれますが、相対順位が、特定の応用に関して制御または監視する変数の数に関する情報を提供します。ある変数から次の変数への相対重要度値の急な低下は、どの変数を制御するかまたは監視するかの決定を導くことができます。たとえば、これらのデータでは、3つの最も重要な変数重要度値は、次の変数に対する相対重要度が40%近く低下する前に比較的近い値です。同じように、3つの変数の重要度は類似した50%近くです。さまざまなグループから変数を削除し、分析をやり直して、さまざまなグループの変数がモデル要約表の予測の正確性の値にどのように影響するかを評価できます。