ツリー図 CART® 分類

デフォルトでは、誤分類コストが最小コストの1標準誤差以内の最小の木が表示されます。

ツリー図を右クリックして、次の操作を実行します。
  • 最も純度が高い5つのノードをハイライト表示します。これらのノードが最適なノードです。
  • 選択したノードに導く予測変数の値をコピーします。これらの値はノードのルールです。
  • ノード分岐ビューを表示します。このビューは、大きな木で、どの変数がノードを分岐するかのみを確認する必要がある場合に有用です。

ルートノードは、木の最上位のノードです。これは親を持たない唯一のノードです。各ノードで、データの特性に応じて、データが2つの子に分割されます。たとえば、ある心臓病患者は労作性狭心症を患っていますか?木の分割するデータがなくなるまで、ノードは分割を続けます。つまり、ターミナルノードはそれ以上のグループに分割されることはありません。

テストデータセットを使用して木のパフォーマンスを検証する場合、ツリー図にはトレーニングデータセットのケースが表示されます。

解釈

ツリー図のターミナルノードへの経路は、より純度が高いグループがどのように形成されているかを示しています。ターミナルノードは、さらなる調査のために、予測変数でより純度が高い各グループをどのように定義するかに関する情報を提供します。各ノードには、クラス、カウント数、およびクラス内のパーセントに関する詳細が含まれます。

ターミナルノードに含まれる情報は、あなたの労力に着目するために、すべての、より純度が高いグループをクラス確率でランク付ける方法も提供します。

ノードID
ノードまたはターミナルノードの呼称を示します。ターミナルノードは、これ以上分岐できない最終ノードです。
クラス
各ターミナルノードには、クラス分類ルールに基づいた特定のクラス分類があります。2値応答の場合、クラスは「はい」 または 「いいえ」となるかもしれません。多項応答の場合、クラスは「第1四半期」、「第2四半期」、「第3四半期」、および「第4四半期」となるかもしれません。
カウント数
特定のクラスのケースの数。
パーセント
特定のクラスのケースのパーセント。
合計カウント数
すべてのクラスのカウント数の合計。