TreeNet® 分類による適合モデルおよび主要な予測変数を検出のROC曲線下面積対木の数プロット

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

ROC曲線下面積と木の数のプロットには、Y 軸上の ROC曲線下の面積と、x 軸上の木の数が表示されます。ROC曲線下の面積は、モデルが適切な分類器であるかどうかを示します。検定結果を使用して、モデルのパフォーマンスを評価して新しい観測値を予測します。トレーニング結果とテスト結果を比較して、トレーニングデータセットのモデルに過剰適合の問題があるかどうかを確認します。

最適モデルの木の数が最尤値によって決まり、その結果、Minitabに平均対数尤度と木の数のプロットが表示されます。最小誤分類率が最適モデルの木の数を決定する場合、Minitabは誤分類率と木の数プロットを表示します。

解釈

分類木の場合、ROC曲線下の面積の通常範囲は0.5から1です。値が大きいほど、分類モデルが適切であることを示します。モデルがクラスを完全に分離できる場合、曲線下の面積は1です。モデルがランダムな割り当てよりも良くクラスを分離できない場合、曲線下の面積は0.5です。

参照線は、テストデータのROC曲線の下の最適な領域とモデル内の木の数を示します。

理想的には、木の数が増えるとテスト曲線が増加し、場合によっては平準化または減少する前に最大値に達します。テスト曲線の最大値が理想的でない場合は、比較する学習率とサブサンプル割合を調整してみてください。