CART® 分類の分析オプションを選択する

統計 > 予測分析 > CART®分類 > オプション

分析オプションを選択します。

ノード分岐法
決定木を生成する分岐方法を選択します。いくつかの分岐方法の結果を比較して、応用に最適な選択肢を決定できます。
  • ジニ: ジニの方法はデフォルトの方法です。ジニの方法は、多くの応用で良好に機能します。ジニの方法は、通常、対象となる応答が集中する小さなノードを含む木を生成します。
  • エントロピー: エントロピーの方法は、ノードの特定の尤度関数の最大値に比例します。
  • Twoing: Twoingの方法は、多項応答でのみ使用できます。Twoingの方法は、通常、ジニの方法またはエントロピーの方法よりもバランスのとれた分割を生成します。2値応答の場合、Twoingの方法はジニの方法と同じです。
  • クラス確率: 確率の木はジニの木よりも大きくなる傾向があります。少数の上位ノードのパフォーマンスに関心がある場合は、確率の方法を使用します。
最適な木を選択するための基準
次の基準から選択して、結果の木を選びます。さまざまな木の結果を比較して、応用に最適な選択肢を決定できます。
  • 最小誤分類コスト: 誤分類コストを最小にする木の結果を表示するには、このオプションを選択します。
  • 最小誤分類コストのK標準誤差内、K =: 最小誤分類コストのK標準誤差内の誤分類コストとなる最小の木の結果を表示するには、このオプションを選択します。デフォルトでは、K=1で、結果は誤分類コストが最小誤分類コストの1標準誤差内で最小の木になります。
欠損値のある予測変数の代理変数の数
予測変数に欠損値がある場合に検索する代理変数の数を入力します。多くの予測変数に同様の欠損値のパターンがある場合は、代理変数の数を増やす必要があります。
この数値は、Minitabが探す代理変数の最大数を表します。ただし、この数の代理変数が実際には見つからない場合があります。
デフォルト値は10です。
内部ノードを分岐する最小ケース数
ノードに属することができ、さらに分割できるケースの最小数を入力します。デフォルトは10です。サンプルサイズが大きい場合、この最小値を増やす必要がある場合があります。たとえば、内部ノードにケースが10個以上ある場合、Minitabは分割を実行しようとします。内部ノードに9個以下のケースがある場合、分割は実行されません。
内部ノードの制限は、ターミナルノードの制限の少なくとも 2倍にする必要があり、比率が大きいほど優れています。ターミナルノードの制限の3倍以上の内部ノードの制限で、適度な数の分岐変数を使用できます。
ターミナルノードで許容される最小ケース数
ターミナルノードに属することができるケースの最小数を入力します。デフォルトは3です。サンプルサイズが大きい場合、この最小値を増やす必要がある場合があります。たとえば、ある分岐で3ケース未満のノードが生成される場合、分岐は実行されません。
木の最大深度
木の最大深さを表す値を入力します。ルートノードは深さ1に対応します。最適な木を確実に得たい場合は、処理が遅くなる可能性はありますが、より深い木を許容する必要があります。
重み
ケースの重みを含む列を入力します。この列の行数は、応答列と同じである必要があります。値は0以上である必要があります。Minitabでは、欠損値またはゼロを含む行は分析から除外されます。