のターミナルノードごとの応答の箱ひげ図 CART® 回帰

箱ひげ図は、各ターミナルノードにおける応答変数の分布のグラフィカルな要約を提供します。箱ひげ図を使用して、ノードの状態、中心傾向、および変動性を比較します。箱ひげ図は、ターミナルノード内のケース数が20を超える場合に、応答値の優れた視覚的な表示です。

解釈

デフォルトでは、ノードは最小誤差から最大誤差の順になっています。分析を実行するとき、グラフボタンを押して、識別番号でノードを並べ替えるオプションを見つけることができます。

分析でテストデータセットを使用する場合、グラフにはトレーニングデータとテストデータ用の別々のプロットが含まれます。テストデータの木のパフォーマンスは、通常、新しいデータに対してその木がどのように働くかを良く示します。テストデータとトレーニングデータの大きな違いは、調査する必要があります。

次の図では、最も高い中央値の3は、最も小さな誤差をもつターミナルノード17、16、および14のものです。ターミナルノード1は、最小の中央値を持もちます。ターミナルノード1と3には1つ外れ値がありますが、一方、外れ値をもつ他のターミナルノードには1つより多い外れ値があります。ターミナルノード8の誤差が最大です。