ROC曲線下の面積と、 適合モデル および 主要な予測変数を検出 のプロット面積 TreeNet® 分類

ROC曲線下面積と樹木数プロットは、ROC曲線下の面積をy軸に、木の数をx軸に示します。ROC曲線下の面積は、モデルが適切な分類器であるかどうかを示します。検証手法を用いる分析では、プロットに検証結果の線が含まれます。検証結果を用いてモデルのパフォーマンスを評価し、新たな観測を予測します。トレーニング結果と検証結果を比較し、トレーニングデータセットのモデルに過学習の問題がないか確認してください。

最尤度値が最適モデルの木数を決定する場合、Minitabは平均対数可能度と木数のプロットを表示します。最小誤分類率が最適モデルの木数を決定する場合、Minitabは誤分類率と木の数プロットを表示します。

解釈

分類木の場合、ROC曲線下の面積の通常範囲は0.5から1です。値が大きいほど、分類モデルが適切であることを示します。モデルがクラスを完全に分離できる場合、曲線下の面積は1です。モデルがランダムな割り当てよりも良くクラスを分離できない場合、曲線下の面積は0.5です。

参照線は、テストデータのROC曲線の下の最適な領域とモデル内の木の数を示します。

理想的には、木の数が増えるにつれて検証結果の曲線が上がり、場合によっては最大値に達すると、レベルアップや減少が進むことが望ましいです。検証結果の曲線の最大値が理想的でない場合は、学習率とサブサンプル割法を調整して比較してみてください。