残差のボックスプロット CART® 回帰

残差の箱ひげ図を使用して、木の全体的な正確性を評価します。解析が検証技術を用いる場合、訓練データと検証結果の木の精度を比較することもできます。

箱ひげ図には、実際の値と適合値の差が表示されます。四分位数の1.5倍を超える点は、最も近い四分位数から個別の記号を持ちます。

解釈

残差が応答変数のスケールに対して0に近い値となるのが理想的です。検証技術を使うと、Minitabはトレーニングデータと検証結果ごとに別々のプロットを作成します。プロットを比較して、トレーニングデータと新しいデータに対する、木の相対的なパフォーマンスを調べることができます。また、訓練データと検証結果の間に違いを示す異なるパターンを探して調査することもできます。

これらのボックスプロットは、訓練データセットと検証結果の両方で同様の結果を示しています。この類似性は、新しいデータに対する木のパフォーマンスが、トレーニングデータに対する木のパフォーマンスに近いことを示唆しています。

両データセットの箱絵の四分位数範囲はおよそ-2.6から2.6の範囲です。データの50%はこの範囲内の残差を持っています。残りの残差は、より大きいです。四分位差範囲が約5であるため、おおよそ範囲–10.5から10.5の範囲外の残差は個別の記号を持ちます。最大の残差は、正方向と負方向の20近くです。これらの大きな残差は、木がすべてのデータにうまく適合していないことを示している可能性があります。