CART® 分類の最良および最悪のターミナルノードの分類の有効性

分類の有効性の統計量を使用して、そのパフォーマンスのため特別な関心の対象となるノードを特徴を把握します。

Minitabでは、各応答水準の表が表示されます。表の各行には、ノードの要約が表示されます。2値の場合と多項の場合の両方で、MinitabはAbs(事象確率 – 0.5)という式を使用してクラス確率でソートします。値が大きくなるほど、ターミナルノードは良好になります。最良のノードは、最良から最悪までの順に表示されます。最悪のノードは、最悪から最良までの順に表示されます。

クラス確率を使用する際にタイがある場合、Minitabでは2番目のソートとしてNの% を使用します。Nの%が最も高いターミナルノードが最初です。この並べ替えの後もまだタイがある場合、Minitabは、「最良」、「最悪」、および「最良と最悪」のシナリオで最初に最小のターミナルノードを表示します。

「最悪」のノード順序でも、タイブレーカーは最初に最大の%Nを表示する必要があるため、「最良」と「最悪」の順序は常に互いに逆になるとは限りません。

テストデータセットを使用する場合、トレーニングデータとテストデータの個別の統計量が計算されます。統計量を比較して、トレーニングデータと新しいデータに対する、木の相対的なパフォーマンスを調べることができます。通常、テストの統計量は、新しいデータに対して木がどのように実行されるのかを示す、優れた指標です。トレーニングとテストのターミナルノードは、それぞれの 事象確率に基づいて個別にランク付けされます。テストデータの観測値を持たないターミナルノードには事象確率がないため、これらのノードは考慮されません。

ターミナルノード
ターミナルノードのID。
イベント数またはクラス数
カウントは、イベント、非イベント、またはクラスのノード内のケースの数です。分析に重みが含まれる場合、カウント数は重み付きカウント数です。多くのケースが含まれるターミナルノードは、通常、より一般的な場合を表すので、特別な関心の対象となる可能性があります。
合計カウント数
合計カウント数は、イベントと非イベントのケースの合計、またはすべてのクラスカウント数の合計です。
Nの%
ノード内のデータのパーセント。
イベント確率またはクラス確率
事象確率は2値応答変数用で、クラス確率は多項応答変数用です。
非イベント確率または非クラス確率
事象確率は2値応答変数用で、非クラス確率は多項応答変数用です。
オッズ
オッズは、非イベントに対するイベントの確率、または非クラスのクラスに対する確率を示します。