CART® 回帰の代替木を選択する

統計 > 予測分析 > CART® 回帰実行します。R二乗対ターミナルノード数のプロットまたは平均絶対偏差対ターミナルノード数プロット代替木を選択ボタンをクリックします。

概要

デフォルトでは、Minitab統計ソフトウェアは、最良の値の1標準誤差内に基準値をもつ最も小さい木の結果を生成します。選択に応じて、基準は最小平方誤差または最小絶対偏差のいずれかになります。Minitabでは、最適な木の特定につながった一連の結果から他の木を探すことができます。通常、代替木は、次の2つのいずれかの理由により選択されます。
  • Minitabが選択する木は、基準が改善されているパターンの一部にあります。さらにいくつかのノードを有する1本以上の木が、同じパターンの一部にあります。通常、できるだけ予測の正確性が高い木から予測を行う必要があります。
  • Minitabが選択する木は、基準が比較的平坦になるパターンの一部にあります。モデルの要約統計量が類似している1本以上の木で、最適な木よりもノード数が非常に少なくなります。通常、ターミナルノードがより少ない木で、各予測変数が応答値にどのように影響するかを明確に把握できます。より小さい木を使用すると、さらに調査を行うために、対象となるいくつかのグループを簡単に特定することもできます。より小さい木の予測の正確性の差がごくわずかである場合は、小さい木を使用して応答と予測変数の関係を評価することもできます。
たとえば、次のプロットは、21個のノードがある木に関する結果に伴うものです。一連の結果の他の木でも、同様のR2値をもちます。
17個のノードがあるきR2値は、21個のノードがある木とほぼ同じ高さになります。通常、ターミナルノードがより少ない木で、各予測変数が応答値にどのように影響するかを明確に把握できます。より小さい木を使用すると、さらに調査を行うために、対象となるいくつかのグループを簡単に特定することもできます。より小さな木からの予測の正確性の低下が無視できる場合は、かなり小さな木を使用して、応答と予測変数の関係を評価することができます。
代替ツリーの基準値に加えて、ツリーの複雑さとさまざまなノードの有用性を比較することもできます。アナリストが他のツリーと比較してもパフォーマンスを犠牲にしない特定のツリーを選択する理由の次の例を考えてみましょう。
  • アナリストは、最も重要な変数の明確なビューを提供する小さなツリーを選択します。
  • 分割は別のツリーの変数よりも測定しやすい変数に基づいて行うため、解析ではツリーが選択されます。
  • 特定のターミナル ノードが対象であるため、アナリストはツリーを選択します。

分析を実行する

出力の代替木を選択をクリックします。ターミナル ノードの数に対する基準のプロット、ツリー図、ツリーまたは選択したノードを要約したテーブルを表示するダイアログ ボックスが開きます。

比較基準

このダイアログボックスでは、代替の木を選択する3つの方法が提供されます。
  • グラフ上の点をクリックします。
  • グラフの右下にある矢印ボタンをクリックして、現在の選択よりも1本大きい木または小さい木を選択します。
  • ボタンをクリックして、一般的な選択の木を選択します。選択は、最適な木の基準が最小平方誤差であるか、最小絶対偏差であるかによって異なります。分析で検証が使用されない場合、標準誤差を参照するボタンは適用されません。
    最小平方誤差
    最大R二乗
    プロット上で最大のR2値を持つ木を選択します。
    1-SE最大R二乗
    最大R2値の1つの標準誤差内のR2値をもつ最小の木を選択します。
    2-SE最大R二乗
    最大R2値の2標準誤差内のR2値をもつ最小の木を選択します。
    最小絶対偏差
    最小MAD
    プロット上で最小の平均絶対偏差 (MAD) 値をもつ木を選択します。
    1-SE MAD
    最小のMADの1標準誤差内のMAD値をもつ最小の木を選択します。
    2-SE MAD
    最小のMAD値の2標準誤差内のMAD値をもつ最小の木を選択します。

ツリーとノードを調査する

このツリーには、ツールバーに次の操作が含まれています。
  • ノードの適合値から最小の変動をもつ5つのノードをハイライト表示します。これらのノードは最適なノードです。
  • 木の基準に応じて、最大の平均または中央値をもつ5つのノードをハイライト表示します。
  • 木の基準に応じて、平均値または中央値が最も低い5つのノードをハイライト表示します。
  • と を切り替えます 詳細な木ノード分割の木ノード分割の木は、大きな木で、どの変数がノードを分岐するかのみを確認する必要がある場合に有用です。
  • ツリーを拡大/縮小します。

ツリー上の個々のノードを選択すると、テーブル内のノードに関する詳細を表示できます。詳細には、基準が最大 R2 の場合は平均値、基準が最小絶対偏差の場合は中央値が含まれます。詳細には、ノードの標準偏差とノードに到達するルールも含まれます。別 クリップボードにルールをコピー の場所にルールを貼り付けることができるようにクリックします。

ツリー全体を再選択するには、図表内の個々のノード以外の場所をクリックします。

新しい木を作成する

木を作成をクリックして、選択した代替の木の結果を生成および保存できます。結果と保存の選択は、元の木と同じです。代替の木のグラフと表は、新しい出力タブに表示されます。保存された列は、元のデータを含むワークシート内にあります。