における誤分類の方法と計算式 CART® 分類

使用する方法または計算式を選択します。

分割方法がクラス確率の場合、誤分類の表はありません。

カウント数と重み付きカウント数

重みを使用しない場合、カウント数とサンプルサイズは同じです。

重み付きの場合、重み付きカウント数はあるカテゴリの重みの合計です。重みがある場合、重み付きカウント数を使用して、異なる重みを計算します。

%不正解

重み付きの場合、カウント数の代わりに重み付きカウント数を使用します。

コスト

コストの計算は、応答変数が2値であるか多項であるかによって異なります。

コスト = (%不正解 × クラスの入力誤分類コスト) / 100

2値応答変数

次式は、事象のクラスのコストを示します。

次式は、非事象のクラスのコストを示します。

次式は、すべてのクラスの全体的なコストを示します。

多項応答変数

多項の場合、この式は、可能性がある誤分類のすべてのタイプを考慮して、2値応答変数の数式を拡張します。たとえば、k個のクラスをもつ多項応答の場合、Y = 1の誤分類コストについては次式を使用します。

次式は、多項式の場合の全体的なコストを示します。

たとえば、3つのクラスと次の誤分類コストをもつ応答変数を考えます。

予測されたクラス
実際のクラス 1 2 3
1 0.0 4.1 3.2
2 5.6 0.0 1.1
3 0.4 0.9 0.0

次に、次の表に不正解のパーセントを示す値を示します。

予測されたクラス
実際のクラス 1 2 3
1 なし 1% 0.5%
2 1.4% なし 2.1%
3 5% 1.2% なし

最後に、応答変数のクラスには、以下の事前確率があるとします。

次式は、応答変数の各クラスの誤分類に関連するコストを示します。

次の式は、全体のコストを示します。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください