の平均平方誤差 (MSE) または平均絶対偏差 (MAD) 対ターミナルノードの散布図 CART® 回帰

MSE対ターミナルノードの散布図またはMAD対ターミナルノードの散布図を使用して、正確性が最も低いノードと最も高いノードを確認します。分析でテストデータセットを使用する場合、トレーニングデータのプロットとテストデータのプロットを比較できます。

ノード分岐方法が最小平方誤差である場合、y軸は平均平方誤差 (MSE) を示します。ノード分岐方法が最小絶対偏差である場合、y軸は平均絶対偏差 (MAD) になります。x軸は、ターミナルノードの識別番号を示します。デフォルトでは、ノードは最小誤差から最大誤差の順に並んでいます。分析を実行するとき、グラフボタンを押して、識別番号でノードを並べ替えるオプションを見つけることができます。

解釈

木がデータに良好に適合する場合、すべてのノードでわずかな誤差が発生するのが理想的です。一般的なパターンは、一部のノードの誤差が他のノードよりも大きくなるものです。最小の誤差のノードからの適合値が最も信頼できます。最も誤差が大きいノードは、変動を減らすか、ノードの変動を説明する追加の予測変数を見つけることによって、木を改善する最良の機会を示す可能性があります。

分析でテストデータセットを使用する場合、プロットには、トレーニングデータに関しておよびテストデータに関しての、別々の点が含まれます。テストデータの木のパフォーマンスは、通常、新しいデータに対してその木がどのように働くかを良く示します。テストデータとトレーニングデータの適合値の正確性の大きな違いについては、調査する必要があります。

このグラフでは、ターミナルノード8の正確性は他のターミナルノードの正確性よりも低いです。MSE値が低いノードの適合度の正確性に関して、比較的信頼度を高めることができます。ターミナルノード8のケースは、変動を減らすか変動を説明する方法が存在する場合に、木を改善する最も大きな機会となる可能性があります。