2値ロジスティックモデルの当てはめ2値ロジスティック回帰の レシーバ動作特性 (ROC) 曲線

ROC曲線は、検出力とも呼ばれる真陽性率 (TPR) をy軸にプロットします。ROC曲線は、第1種の過誤とも呼ばれる偽陽性率 (FPR) をx軸にプロットします。ROC曲線下の面積は、2値モデルが適切な分類器であるかどうかを示します。

解釈

ROC曲線下の面積の範囲は0.5から1です。2値モデルがクラスを完全に分離できる場合、曲線下の面積は1です。2値モデルがランダムな割り当てよりも良くクラスを分離できない場合、曲線下の面積は0.5です。

別のテストセットを使用しない場合、データセットによってROC曲線が作成されます。

この例では、テストの曲線下の面積は0.9405です。

検証方法では、Minitabは2つのROC曲線を作成します。1 つの曲線はトレーニング データ用で、もう 1 つは検証データ用です。validationの結果は、モデルが新しい観測値の応答値を適切に予測できるか、または応答変数と予測変数の関係を適切に要約できるかを示します。トレーニングの結果は通常、実際よりも理想的であり、参考に過ぎません。

ROC曲線の下のK分割面積がROC曲線の下の面積よりも大幅に小さい場合は、モデルが過剰適合していることを示している可能性があります。過剰適合は、母集団には重要でない項がモデルに含まれている場合に起こります。モデルはトレーニングデータに即してしまい、母集団の予測に適さなくなる可能性があります。

この例では、学習曲線はテスト曲線よりも適合度が高いことを示しています。テスト曲線のパフォーマンスは、通常、新しいデータに対するモデルのパフォーマンスをより適切に表しています。テストの曲線下の面積は0.8882です。