の事前確率と誤分類コストを指定する CART® 分類

統計 > 予測分析 > CART®分類 > 事前/コスト

応答水準の事前確率

事前確率とは、データを収集する前に、観測値があるグループに分類される確率です。事前確率を指定しない場合、グループは同等に起こり得ると見なされます。
  • すべてのレベルは等しい確率を持つ:デフォルトでは、すべての応答水準に対して等しい事前確率が使用されます。たとえば、応答に4つの水準がある場合、各水準は0.25に設定されます。
  • 確率は全体のサンプル度数と対応する:サンプルの比率に応じて、事前確率を設定します。たとえば、観測の総数が1000個で、250個が水準1、475個が水準2、100個が水準3、175個が水準4の場合、これらの水準の比率は0.25、0.475、0.10、および 0.175になります。
  • 各水準の事前確率を指定する:各水準の事前確率を設定します。各値は0から1の間でなければなりません。すべての水準の確率の合計が1になる必要があります。

誤分類コスト

誤分類のコストを指定します。デフォルトでは、Minitabは等しく1コストを使用します。コストが高いことを示すには、大きな値を使用します。コストは0より大きい値にする必要があります。

たとえば、次の表は、見込み客を誤って分類するコストが、関心のない顧客を誤って分類する場合よりも10倍高いことを示しています。コストの比率は、実際のコストではなく関連性のあるものです。

予測された水準
実際の水準 はい(事象) いいえ
はい(事象)   10
いいえ 1