CART® 分類のデフォルト設定を指定

ファイル > オプション > 予測分析 > CART®分類

分類ツリーの既定の方法を指定します。デフォルトに加えた変更は、Minitabを終了しても、再度変更するまで維持されます。

ノード分岐法
ディシジョンツリーを生成する分割方法を選択します。いくつかの分割方法の結果を比較して、アプリケーションに最適な選択肢を決定できます。
  • : Gini メソッドはデフォルトの方法です。Gini メソッドは、多くのアプリケーションでうまく機能します。Gini法は通常、関心の高い応答を持つ小さなノードを含む木を生成します。
  • : エントロピー法は、ノードの特定の尤度関数の最大値に比例します。
  • : Twoing メソッドは多項応答でのみ使用できます。Twoing法は、通常、ジニ法やエントロピー法よりもバランスの取れた分割を生成します。バイナリ応答の場合、Twoing メソッドは Gini メソッドと同じです。
  • : 確率ツリーはジニツリーよりも大きくなる傾向があります。いくつかの上位ノードのパフォーマンスに関心がある場合は、確率方法を使用します。
最適な木を選択するための基準
次の条件から選択して、結果のツリーを選択します。異なるツリーの結果を比較して、アプリケーションに最適な選択肢を決定できます。
  • : このオプションを選択すると、誤分類コストを最小化するツリーの結果が表示されます。
  • : 最小誤分類コストの K 標準誤差内での最小ツリーの結果と誤分類コストを表示するには、このオプションを選択します。デフォルトでは K=1 なので、結果は最小の誤分類コストでツリーの 1 標準誤差内の誤分類コストを持つ最小のツリーに対して行われます。
内部ノードを分岐する最小ケース数
内部ノードを分割するケースの最小数を表す値を入力します。デフォルトは10です。サンプル サイズが大きい場合は、この最小値を増やしてください。たとえば、内部ノードに 10 以上のケースがある場合、分割を試行します。内部ノードのケースが9以下の場合、分割は試行されません。
The internal node limit must be at least twice the terminal node limit, but larger ratios are better. 端末ノードの制限の 3 倍以上の内部ノード制限により、適切な数のスプリッタが許可されます。
デフォルトの値は10です。
ターミナルノードで許容される最小ケース数
ターミナル ノードに分割できるケースの最小数を表す値を入力します。デフォルトは 3 です。サンプル サイズが大きい場合は、この最小値を増やしてください。たとえば、分割によってケースが 3 つ未満のノードが作成される場合、分割は実行されません。
デフォルトの値は3です。
値ペナルティの欠落
欠損値を持つ予測変数のペナルティ値を入力します。データが少ないスプリッターの方が簡単なので、データが不足している予測変数は、データが欠落することなく予測変数よりも優れた利点があります。このオプションを使用して、不足データを使用して予測変数にペナルティを課します。
0.0 ≤ K ≤ 2.0 たとえば:
  • K = 0: ペナルティなしを指定します。
  • K = 2: 最高のペナルティを指定します。
高レベルカテゴリペナルティ
多くの値を持つカテゴリ予測変数のペナルティ値を入力します。多くのレベルを持つカテゴリ予測変数は、分割力の増加によりツリーを歪める可能性があるため、レベルの低い予測変数よりも利点があります。このオプションを使用して、多くのレベルの予測変数にペナルティを課します。
0.0 ≤ K ≤ 5.0 たとえば:
  • K = 0: ペナルティなしを指定します。
  • K = 5: 最高のペナルティを指定します。
グラフと表の表示
混同行列からの率
混同行列に表示するレートを選択します。
  • 真正数: 真正率 (TPR) - イベントケースが正しく予測される確率。
  • 誤検知: 誤検知率 (FPR) - 非イベントのケースが誤って予測される確率。
  • 偽負数: 偽負率 (FNR) - イベントケースが誤って予測される確率。
  • 真負数: 真負数 (TNR) - 非イベントケースが正しく予測される確率。
受信者動作特性 (ROC) 曲線
受信機動作特性(ROC)曲線は、クラスを区別するツリーの能力を示しています。ROC 曲線は、偽陽性率(FPR)に対する真正率(TPR)をプロットします。
ゲインチャート
累積ゲイン・グラフは、母集団の一部におけるモデルの効果を示しています。ゲインチャートは、% クラスと母集団の対をプロットします。
リフトチャート
リフト チャートは、予測モデルの有効性を示しています。リフト チャートは累積リフト対母集団の比較を示し、予測モデルの有無にかかわらず得られた結果の差を表示します。このグラフに対して、またはを指定できます。
ターミナルノードのタイプ
分類テーブルの [有効性] テーブルと [分類項目の分類基準] テーブルに、最適なノード、最悪のノード、またはその両方を表示するかどうかを選択します。
  • :デフォルトでは、最適な端子ノードが表示されます。最適なノードは、最も高い事象確率 (バイナリ) または最高クラスの確率 (多項式) 値を持ちます。For a binary response, the best nodes have event probabilities close to the two end cases of 1 or 0.
  • : 最悪の端子ノードを表示する場合に選択します。最悪のノードは、最低事象確率 (バイナリ) または最低クラス確率 (多項式) 値を持ちます。バイナリ応答の場合、最悪のノードのイベント確率は中間値 0.5 に近い値になります。
  • : 最適なターミナル ノードと最悪のターミナル ノードを表示する場合に選択します。