ベストモデルの検出(2値応答) から代替モデルを選択

予測分析モジュール > 自動機械と学習 > ベストモデルの検出(2値応答)を実行します。結果の代替モデルの選択をクリックします。

注

このコマンドは、で使用できます予測分析モジュール。モジュールをアクティブにする方法については、ここをクリックしてください。

このトピックの内容

概要
Random Forests^® 回帰
ツリーネット^®
ロジスティック回帰
CART®

概要

ベストモデルの検出(2値応答) を使用して最も重要度の低い予測変数を削除する場合、Minitab統計ソフトウェアは、最小平均対数尤度など、分析の精度基準の最適値を使用してモデルの結果を生成します。Minitabでは、他のモデルや他のタイプのモデルの結果を調べることができます。たとえば、別の種類のモデルで同様の予測精度が得られる場合、各タイプのモデルで同じ予測変数が重要かどうかを判断できます。

項目のIDは、アプリケーションのタイプによって決まります。CART^® と二項ロジスティック回帰モデルの場合、検索から最適なモデルの結果を調べることができます。ランダムフォレスト^® および TreeNet^® モデルの場合、検索で任意のモデルの結果を調べることができます。Random Forests^® と TreeNet^® モデルの場合、ハイパーパラメーターを調整して、検索のハイパーパラメーターよりも優れた値を生成する組み合わせを検索することもできます。

Random Forests^® 回帰

既存のモデルを選択して、検索からいずれかのモデルの結果を生成します。新しいモデルに適合するハイパーパラメーターを指定して、モデルのパフォーマンスを向上させるハイパーパラメーターの組み合わせを探します。

既存のモデルを選択する

最適なモデルの検索では、内部ノードの最小サイズが異なる最大 3 つのランダムフォレスト^® モデルが生成されます。リストからモデルを選択し、クリック結果を表示してそのモデルの結果を生成します。

新しいモデルに合わせてハイパーパラメーターを指定する

解析では、最初の 3 つのハイパーパラメーターを指定する必要があります。トレーニングデータサイズより小さいブートストラップのサンプルサイズを指定する結果を表示クリックして、新しいモデルのハイパーパラメーターを評価します。結果には、ハイパーパラメーターのさまざまな組み合わせの最適性基準と、モデルのモデル結果を、最小平均 -対数尤度などの最適な値を使用して比較する表が含まれます。

ノード分割の予測変数の数: 各ノード分割について考慮する予測変数の数を指定します。通常、予測変数の総数の平方根を考慮すると、分析が適切に機能します。ただし、いくつかのデータセットは、分析が各ノードの予測変数がより多い、またはより少ない場合を考慮したときに、モデルパフォーマンスの向上につながる予測変数間の関連性を持っています。
内部ノードを分岐する最小ケース数: ノードに属することができ、さらに分割できるケースの最小数を入力します。デフォルトでは、元の検索には 2、5、8 という数字が含まれます。
木を増加させるブートストラップサンプルの数: 値を入力して、ブートストラップサンプルの数と解析によって生成される木の数を決定します。3から3000までの値を入力します。
トレーニングデータサイズより小さいブートストラップのサンプルサイズを指定する: ブートストラップのサンプルサイズを設定する値を選択して入力します。%5以上の値を入力してください。トレーニングデータサイズよりも大きなサイズを入力すると、トレーニングデータサイズと同じサンプルサイズが使用されます。

ツリーネット^®

既存のモデルを選択する

最適なモデルの検索では、ハイパーパラメーターの組み合わせごとに、TreeNet^® モデルが生成されます。リストからモデルを選択し、クリック結果を表示してそのモデルの結果を生成します。

新しいモデルに合わせてハイパーパラメーターを指定する

解析では、すべてのハイパーパラメーターを指定する必要があります。結果を表示クリックして、新しいモデルのハイパーパラメーターを評価します。結果には、ハイパーパラメーターのさまざまな組み合わせの最適性基準と、モデルの結果を、分析の精度基準の最適な値 (平均 -対数尤度の最小値など) と比較する表が含まれます。

学習率

最大10個の値を入力します。有効値は0.0001～1の範囲になります。

サブサンプル割合

最大10個の値を入力します。有効値は0より大きく1以下の数です。

木あたりの最大ターミナルノード数および木の最大深度

木あたりの最大ターミナルノード数または木の最大深度のどちらを評価するかを選択します。通常、どちらの選択も有用なモデルを識別する妥当な方法であり、選択は各自の好みによって行われます。

最大ターミナルノード数: 最大3個の値を入力します。有効値は2～2000の範囲になります。2の値は交互作用の調査を除外します。
木の最大深度: 最大3個の値を入力します。木の最大深さを表すのに有効な値は2～1000です。ルートノードは深さ1に対応します。多くのアプリケーションでは、4から6までの深さで、合理的に良いモデルが得られます。

ノード分割の予測変数の数

最大3個の値を入力します。対象となる値は、1 から予測変数の合計数の間です。通常、予測変数の総数の平方根を考慮すると、分析が適切に機能します。ただし、いくつかのデータセットは、分析が各ノードの予測変数がより多い、またはより少ない場合を考慮したときに、モデルパフォーマンスの向上につながる予測変数間の関連性を持っています。

木の数

1～5000の値を指定して、構築する木の最大数を設定します。デフォルト値の300は、通常、ハイパーパラメーター値の評価に有用な結果を提供します。

対象となる1つ以上のモデルが、指定した木の数に近い木の数を持つ場合は、木の数を増やすかどうかを検討します。木の数が最大数に近い場合、木の数を増加するとモデルのパフォーマンスが向上する可能性が高くなります。

ロジスティック回帰

最適なロジスティック回帰モデルの結果結果を表示モデルタイプの検索から最適な二項ロジスティック回帰モデルの結果を生成するには、選択してクリックします。

CART®

最適 CART®モデルの結果結果を表示なタイプのモデルの検索から最適な CART^® モデルの結果を生成するには、選択してクリックします。

ベストモデルの検出(2値応答) から代替モデルを選択

注

このトピックの内容

概要

Random Forests® 回帰

既存のモデルを選択する

新しいモデルに合わせてハイパーパラメーターを指定する

ツリーネット®

既存のモデルを選択する

新しいモデルに合わせてハイパーパラメーターを指定する

ロジスティック回帰

CART®

Random Forests^® 回帰

ツリーネット^®