の平均絶対偏差 (MAD) 対ターミナルノード数のプロット CART® 回帰

Minitabでは、木のターミナルノード数に対する平均絶対偏差 (MAD) 値のプロットを表示して、ある木を選択してさらに評価することができます。テストデータセットまたはK分割交差検証を使用して木のパフォーマンスを検証する場合、MAD値は検証データに関するものです。

MAD対ターミナルノード数のプロットには、各木のMAD値が表示されます。このプロットは、ノード分岐方法が最小絶対偏差の場合に表示されます。デフォルトでは、最初の回帰木は最小のMAD値の1標準誤差内のMADをもつ最小の木です。分析で交差検証またはテストデータセットを使用する場合、MAD値は検証サンプルから得られます。検証サンプルの値は、通常は横ばいになり、木が大きくなるにつれて最終的に増加し始めます。

代替木を選択をクリックして、モデルの要約の統計量の表を含むインタラクティブプロットを開きます。このプロットを使用して、類似したパフォーマンスの代替の木を調査します。

通常、代替の木は、次の2つの理由のいずれかのため選択されます。
  • Minitabが選択する木は、基準が改善されているパターンの一部にあります。さらにいくつかのノードがある1本以上の木が同じパターンの一部にあります。通常、できるだけ予測の正確性が高い木から予測を行う必要があります。
  • Minitabが選択する木は、基準が比較的平坦になるパターンの一部にあります。モデルの要約統計量が類似している1本以上の木で、最適な木よりもノード数が非常に少なくなります。通常、ターミナルノードがより少ない木で、各予測変数が応答値にどのように影響するかを明確に把握できます。より小さい木を使用すると、さらに調査を行うための、いくつかの目的のグループをより簡単に特定できます。より小さい木の予測の正確性の差がごくわずかである場合は、小さい木を使用して応答と予測変数の関係を評価することもできます。

解釈

主要な結果:34個のターミナルノードがある木のMAD対ターミナルノード数のプロット

34個のターミナルノードがある回帰木のMAD値は約0.38です。木の生成基準が、最小絶対偏差の1標準誤差内の偏差をもつ最小の木であったため、この木には「最適」というラベルがつけられます。このグラフは、約30個のノードがある木と約80個のノードがある木の間でMAD値が比較的安定していることを示しているため、研究者は、結果の木と類似した何本かのより小さな木のパフォーマンスを調べたいと考えます。次のグラフを比較して、29個のノードがある木の結果を確認します。

主要な結果:29個のターミナルノードがある木の、MAD対ターミナルノード数のプロット

29個のターミナル ノードがある回帰木のMAD値は0.3826です。代替木を選択を使用して別の木の結果を生成する場合、最初の結果の木は「最適」というラベルを保持します。