のツリー図 CART® 回帰

デフォルトでは、最大R2値の1標準誤差内にあるR2値をもつ最小の木が表示されます。

ツリー図を右クリックすると、次の操作が実行されます。
  • ノードの適合値に関して最小の変動をもつ5つのノードをハイライト表示します。これらのノードが最適なノードです。
  • 木の基準に応じて、平均または中央値が最も高い5つのノードをハイライト表示します。
  • 木の基準に応じて、平均または中央値が最も低い5つのノードをハイライト表示します。
  • 選択したノードに導く予測変数の値をコピーします。これらの値はノードのルールです。
  • ノード分岐ビューを表示します。このビューは、大きな木で、どの変数がノードを分岐するかのみを確認する必要がある場合に有用です。

ルートノードは木の最上位のノードであり、親を持たない唯一のノードです。各ノードでは、データの特性に応じて、データが2つの子に分割されます。木で分割するデータがなくなるまで、ノードは分割を続けます。つまり、ターミナルノードをそれ以上のグループに分割することはできません。

テストデータセットを使用して木のパフォーマンスを検証する場合、ツリー図にトレーニングデータセットの場合が表示されます。

解釈

各ノードには、平均、標準偏差、およびカウント数の詳細が含まれます。

ノードID
ノードまたはターミナル ノードの呼称を指定します。ターミナルノードは、これ以上分岐できない最終ノードです。
平均
平均は、ノード内のケースの平均応答値です。平均は、同じノードに含まれる新しいデータの予測値です。他のターミナルノードと大きく異なる平均をもつターミナルノードは、それらのターミナルノードのケースの予測が大きく異なるため、特別な関心の対象となる可能性があります。たとえば、最大または最小の平均は、特別な関心の対象となる可能性があります。
標準偏差
標準偏差は、ノード内の応答値の標準偏差です。標準偏差が小さいターミナルノードは、標準偏差が大きいターミナルノードよりも精度が高いため、特別な関心の対象となる可能性があります。
合計カウント数
合計カウント数は、ノード内のケースの数です。分析に重みが含まれる場合、カウント数は合計の重み付きカウント数になります。多くのケースが含まれるターミナルノードは、通常、より一般的な場合を表すので、特別な関心の対象となる可能性があります。