の混同行列CART® 分類

混同行列のすべての統計量の定義と解釈について理解してください。
混同行列は、次の基準を使用して、木がクラスをどの程度正しく分類しているかを示します。
  • 真陽性率 (TPR) — 事象のケースが正しく予測される確率
  • 偽陽性率 (FPR) — 非事象のケースが誤って予測される確率
  • 偽陰性率 (FNR) — 事象のケースが誤って予測される確率
  • 真陰性率 (TNR) — 非事象のケースが正しく予測される確率

解釈

混同行列



予測クラス(トレーニング)予測クラス(テスト)
実クラス計数はいいいえ%正はいいいえ%正
はい (事象)1391172284.21053475.5
いいえ1642214286.62414085.4
すべて30313916485.512917480.9
統計量トレーニング(%)テスト(%)
真陽性率(感度または検出力)84.275.5
偽陽性率(第一種過誤)13.414.6
偽陰性率(第二種過誤)15.824.5
真陰性率(特異度)86.685.4

この例では、「はい」の事象の総数は139で、「いいえ」の事象の総数は164です。
  • トレーニングデータでは、予測された「はい」の事象の数は117で、84.2%正しいです。
  • トレーニングデータでは、予測された「いいえ」の事象の数は142で、86.6%正しいです。
  • テストデータでは、予測された「はい」の事象の数は105で、75.5%正しいです。
  • テストデータでは、予測された「いいえ」の事象の数は140で、80.9%正しいです。
全体として、トレーニングデータの%正解は85.5%で、 テストデータの場合は80.9%です。
  • 真陽性率 (TPR) — トレーニングデータの場合は84.2%、テストデータの場合は75.5%です。
  • 偽陽性率(FPR) — トレーニングデータの場合は13.4%、テストデータの場合は14.6%です。