TreeNet® 分類による適合モデルおよび主要な予測変数を検出の混乱行列

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

混同行列のすべての統計量の定義と解釈について理解してください。
混同行列は、次の基準を使用して、木がクラスをどの程度正しく分類しているかを示します。
  • 真陽性率 (TPR) — 事象のケースが正しく予測される確率
  • 偽陽性率 (FPR) — 非事象のケースが誤って予測される確率
  • 偽陰性率 (FNR) — 事象のケースが誤って予測される確率
  • 真陰性率 (TNR) — 非事象のケースが正しく予測される確率

解釈

TreeNet® 分類: 心臓病 対 年齢, レスト血圧, コレステロール, 最大心拍数, オールドピーク, セックス, 胸痛タイプ, 断食血糖, ...

混同行列 予測クラス(トレーニング) 予測クラス(テスト) 実クラス 計数 はい いいえ %正 はい いいえ %正 はい (事象) 139 124 15 89.21 110 29 79.14 いいえ 164 8 156 95.12 24 140 85.37 すべて 303 132 171 92.41 134 169 82.51 行の事象確率が0.5を超える場合、事象クラスに行を割り当てます。
統計量 トレーニング(%) テスト(%) 真陽性率(感度または検出力) 89.21 79.14 偽陽性率(第一種過誤) 4.88 14.63 偽陰性率(第二種過誤) 10.79 20.86 真陰性率(特異度) 95.12 85.37

この例では、「はい」の事象の総数は139で、「いいえ」の総数は164です。
  • トレーニングデータでは、予測された事象(「はい」)の数は124で、89.21%正しいです。
  • トレーニングデータでは、予測された非事象(「いいえ」)の数は156で、95.12%正しいです。
  • 検定データでは、予測された事象(「はい」)の数は110で、79.14%正しいです。
  • 検定データでは、予測された非事象(「いいえ」)の数は140で、85.37%正しいです。
全体として、トレーニングデータの正解率は92.41%で、検定データでは82.51%です。テストデータの結果を使用して、新しい観測値の予測精度を評価します。

正解率の値が低いのは、通常、近似モデルの不足が原因です。これは、いくつかの理由で発生する可能性があります。正解率の値が非常に低い場合は、クラスの重みが役立つかどうかを検討してください。クラスの重みは、あるクラスからの観測値が異なるクラスの観測値よりも重み付けされる場合に、より正確なモデルを提供するのに役立ちます。また、ケースがイベントとして分類される必要がある場合の確率を変更することもできます。