CART® 分類のゲインチャートとリフトチャート

ゲインとリフトチャートを使用して、分類モデルのパフォーマンスを評価します。ゲインチャートは、合計カウント数のパーセントに対するパーセントで合計陽性率をプロットします。したがって、たとえば、これらのグラフは、イベントの80%がデータの20%にあることを示します。したがって、データの20%に焦点を当てることで、リソースを効率的に使用できます。リフトチャートでは、累積リフト(または非累積リフト)と合計カウント数の割合をプロットします。

ゲインチャートの解釈

トレーニング行とテスト行は、予測モデルを使用して予想される応答を表します。トレーニング データセットはモデルに適合し、テストデータセットはモデルを評価します。点線の参照線は、傾斜角が1の線を表し、モデルを使用しないランダム応答が予想されます。1より大きなゲインは、予測モデルの結果がランダムよりも優れているということを示します。

この例では、ゲインチャートは参照線の上に急激に増加し、次に平坦化を示しています。この場合、データの約40%が真陽性の約70%を占めています。

リフトチャートの解釈

トレーニング行とテスト行は、予測モデルを使用して予想される応答を表します。トレーニング データセットはモデルに適合し、テストデータセットはモデルを評価します。リフトは、予想されるランダムな結果に対するゲイン率のパーセントです。点線の参照線は累積リフト1を表し、ランダムと比較してゲインがないことを意味します。

この例では、リフトチャートは、徐々に落ちる基準線の上に増加を示しています。