の混同行列 CART® 分類

混同行列のすべての統計量の定義と解釈について理解してください。
混同行列は、次の基準を使用して、木がクラスをどの程度正しく分類しているかを示します。
  • 真陽性率 (TPR) — 事象のケースが正しく予測される確率
  • 偽陽性率 (FPR) — 非事象のケースが誤って予測される確率
  • 偽陰性率 (FNR) — 事象のケースが誤って予測される確率
  • 真陰性率 (TNR) — 非事象のケースが正しく予測される確率

解釈

7ノード CART® 分類:心臓病 対 年齢, レスト血圧, コレステロール, 最大心拍数, オールドピーク, セックス, 断食血糖, 運動狭心症, レスト心電図, 斜面, タール, 胸痛タイプ, 主要な船舶

混同行列 予測クラス(トレーニング) 予測クラス(テスト) 実クラス 計数 はい いいえ %正 はい いいえ %正 はい (事象) 139 117 22 84.2 105 34 75.5 いいえ 164 22 142 86.6 24 140 85.4 すべて 303 139 164 85.5 129 174 80.9 統計量 トレーニング(%) テスト(%) 真陽性率(感度または検出力) 84.2 75.5 偽陽性率(第一種過誤) 13.4 14.6 偽陰性率(第二種過誤) 15.8 24.5 真陰性率(特異度) 86.6 85.4

この例では、「はい」の事象の総数は139で、「いいえ」の事象の総数は164です。
  • トレーニングデータでは、予測された「はい」の事象の数は117で、84.2%正しいです。
  • トレーニングデータでは、予測された「いいえ」の事象の数は142で、86.6%正しいです。
  • テストデータでは、予測された「はい」の事象の数は105で、75.5%正しいです。
  • テストデータでは、予測された「いいえ」の事象の数は140で、80.9%正しいです。
全体として、トレーニングデータの正解率は85.5%で、テストデータでは80.9%です。
  • 真陽性率 (TPR) — トレーニングデータの場合は84.2%、テストデータの場合は75.5%です。
  • 偽陽性率(FPR) — トレーニングデータの場合は13.4%、テストデータの場合は14.6%です。