の代替の木を選択する カート®分類

予測分析 > CART® 分類 を実行します。のボタンをクリックします。代替木を選択誤分類コスト対ターミナルノード数のプロット

概要

デフォルトでは、Minitab統計ソフトウェアは、最小誤分類コストの1標準誤差内の誤分類コストを有する最小の木の出力を生成します。Minitabでは、最適な木の特定につながった一連の結果から他の木を探ることができます。通常、代替の木は、次の2つの理由のいずれかのため選択されます。
  • 最適な木は、誤分類コストが減少しているパターンの一部にあります。さらにいくつかのノードがある1本以上の木が同じパターンの一部にあります。通常、できるだけ予測の正確性が高い木から予測を行う必要があります。木が単純な場合、各予測変数が応答値にどのように影響するかを理解するために使用することもできます。
  • 最適な木は、誤分類コストが比較的平坦なパターンの一部にあります。モデルの要約統計量が類似している1本以上の木が、最適な木よりもかなり少ないノード数を有しています。通常、ターミナルノードがより少ない木で、各予測変数が応答値にどのように影響するかを明確に把握できます。より小さい木を使用すると、さらに調査を行うための、いくつかの目的のグループをより簡単に特定できます。より小さい木の予測の正確性の差がごくわずかである場合は、小さい木を使用して応答変数と予測変数の関係を評価することもできます。
たとえば、次のプロットでは、4つのノードをもつ木が最適な木です。次の2本の大きな木は、誤分類コストが減少しているパターンの一部にあります。
7つのノードの木の誤分類コストは、4つのノードの木のコストよりも低くなります。7つのノードの木は複雑さにおいて類似しているため、さらに予測の正確性が高いより大きな木を使用して、重要な変数を調べたり、予測を行うことができます。

解析を実行する

出力の代替木を選択をクリックします。プロットとモデル要約表を表示するダイアログボックスが開きます。このダイアログボックスでは、代替の木を選択する3つの方法が用意されています。
  • グラフ上の点をクリックします。
  • モデル要約表の下にある矢印ボタンをクリックして、現在の選択よりも 1本大きい木または小さい木を選択します。
  • ボタンをクリックして、一般的な選択の木を選択します。分析で検証が使用されない場合、標準誤差を参照するボタンは適用されません。
    最小コスト
    誤分類コストが最小の木を選択します
    1-SE最小コスト
    最小コストの1標準誤差内の誤分類コストを有する最小の木を選択します。
    2-SE最小コスト
    最小コストの2標準誤差内の誤分類コストを有する最小の木を選択します。
    最善ROC
    ROC曲線下の面積が最大の木を選択します。

木を作成をクリックして、選択した代替の木の結果を生成および保存できます。結果と保存の選択は、元の木と同じです。代替の木のグラフと表は、新しい出力タブに表示されます。保存された列は、元のデータを含むワークシート内にあります。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください