のターミナルノードごとの残差のプロット CART® 回帰

残差は、各ノードの誤差のグラフィカルな要約を提供します。このプロットは、ノードの正確性の比較を単純化します。

解釈

残差は、ノード内の誤差を要約し、適合が不十分なケースを特定するのに役立ちます。応答変数のスケールに対して、残差が小さいノードの適合度が最も信頼できます。残差の幅が広いノードは、より多くの変動を減らすか説明する状況を表す可能性があります。異常なパターンを示すケースを調査するかどうかを選択できます。

デフォルトでは、ノードは最小誤差から最大誤差の順になっています。分析を実行するとき、グラフボタンを押して、識別番号でノードを並べ替えるオプションを見つけることができます。

分析でテストデータセットを使用する場合、グラフにはトレーニングデータとテストデータ用の別々のプロットが含まれます。テストデータの木のパフォーマンスは、通常、新しいデータに対してその木がどのように働くかを良く示します。テストデータとトレーニングデータの大きな違いは、調査する必要があります。

次のプロットでは、ターミナルノード1は最大の残差を含みます。ターミナルノード13は負の残差の痕跡があります。これらの点をさらに調査すると、木がこれらの点とノード内の他の点に適合しない理由が明らかになる可能性があります。ターミナルノード17は、ターミナルノードの最小の平均平方誤差 (MSE) を有します。ターミナルノード17の残差の範囲は、プロットの反対側のノードに比べて比較的小さいです。