CART® 回帰の応答適合値対実際の値の散布図

散布図を使用して、予測の正確性を評価します。また、分析で検証法を使用する場合、トレーニングデータとテストデータの木の正確性を比較することができます。

散布図では、実際の応答値がx軸に、適合応答値がy軸に表示されます。計算された線は、実際の値と応答値が等しい場合を表します。テストデータ内の外れ値または異常な点のクラスターは、より多くの調査に値するデータを示している可能性があります。

解釈

線が点のセットの中央を通過し、点が応答変数のスケールに対して線に近くなるのが理想的です。検証法を使用すると、トレーニングデータとテストデータ用に別々のプロットが作成されます。プロットを比較して、トレーニングデータと新しいデータに対する、木の相対的なパフォーマンスを調べることができます。トレーニングデータとテストデータの間で調査すべき違いを示す、さまざまなパターンを探すこともできます。

この散布図では、トレーニングデータセットとテストデータセットの点は、類似したパターンを示しています。この類似性は、新しいデータに対する木のパフォーマンスが、トレーニングデータに対するの木のパフォーマンスに近いということを示唆しています。