代替モデルを選択する ベストモデルの検出(連続応答)

予測分析モジュール > 自動機械と学習 > ベストモデルの検出(連続応答)を実行します。 モデル選択表の後で、代替モデルを選択 をクリックします。

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

を使用して ベストモデルの検出(連続応答) 最適なモデルタイプを特定すると、Minitab統計ソフトウェアは、最大R2など、分析の精度基準の最適な値を持つモデルの結果を生成します。Minitabでは、他のモデルや他のタイプのモデルの結果を調べることができます。たとえば、別のタイプのモデルが同様の予測精度を生成する場合、各タイプのモデルで同じ予測変数が重要であるかどうかを判断できます。

使用可能なオプションは、モデルのタイプによって異なります。重回帰モデルとCART® モデルの場合、検索から最適なモデルの結果を調べることができます。Random Forests®、TreeNet®、およびMARS® モデルでは、検索内の任意のモデルの結果を調べることができます。Random Forests®、TreeNet® 、および MARS® モデルでは、ハイパーパラメーターを調整して、検索のハイパーパラメーターよりもさらに優れた値を生成する組み合わせを探すこともできます。

Random Forests®

既存のモデルを選択して、検索からいずれかのモデルの結果を生成します。新しいモデルに適合するハイパーパラメータを指定して、モデルのパフォーマンスを向上させるハイパーパラメータの組み合わせを探します。

既存のモデルを選択する

最適なタイプのモデルを検索するために、分析では、内部ノードの最小サイズが異なる最大3つのRandom Forests® モデルが生成されます。リストからモデルを選択し、 をクリックして 結果を表示 そのモデルの結果を生成します。

新しいモデルに合わせてハイパーパラメーターを指定する

分析では、最初の 3 つのハイパーパラメータを指定する必要があります。トレーニングデータサイズより小さいブートストラップサンプルサイズを含めることはオプションです。クリックして 結果を表示 、新しいモデルのハイパーパラメータを評価します。結果には、ハイパーパラメータのさまざまな組み合わせの最適性基準と、最大R2などの最適性基準の最適値を持つモデルのモデル結果を比較するテーブルが含まれます。
ノード分割の予測変数の数
ノード分割ごとに考慮する予測変数の数を 1 から 3 個指定します。通常、予測変数の総数の平方根を考慮すると、分析が適切に機能します。ただし、いくつかのデータセットは、分析が各ノードの予測変数がより多い、またはより少ない場合を考慮したときに、モデルパフォーマンスの向上につながる予測変数間の関連性を持っています。
内部ノードを分岐する最小ケース数
ノードが持つことができるケースの最小数を 1 から 3 入力し、さらに多くのノードに分割します。デフォルトでは、元の検索には番号 2、5、および 8 が含まれます。
木を増加させるブートストラップサンプルの数
値を入力して、ブートストラップサンプルの数と解析によって生成される木の数を決定します。3から3000までの値を入力します。
トレーニングデータサイズより小さいブートストラップのサンプルサイズを指定する
ブートストラップのサンプルサイズを設定する値を選択して入力します。%5以上の値を入力してください。トレーニングデータサイズよりも大きなサイズを入力すると、トレーニングデータサイズと同じサンプルサイズが使用されます。

TreeNet®

既存のモデルを選択して、検索からいずれかのモデルの結果を生成します。新しいモデルに適合するハイパーパラメータを指定して、モデルのパフォーマンスを向上させるハイパーパラメータの組み合わせを探します。

既存のモデルを選択する

最適なタイプのモデルを検索するために、分析ではハイパーパラメーターの組み合わせごとに TreeNet® モデルが生成されます。リストからモデルを選択し、 をクリックして 結果を表示 そのモデルの結果を生成します。

新しいモデルに合わせてハイパーパラメーターを指定する

分析では、すべてのハイパーパラメータを指定する必要があります。クリックして 結果を表示 、新しいモデルのハイパーパラメータを評価します。結果には、ハイパーパラメーターのさまざまな組み合わせの最適性基準と、分析の精度基準の最適値 (最大 R2など) を持つモデルの結果を比較するテーブルが含まれます。

学習率
最大10個の値を入力します。有効値は0.0001~1の範囲になります。
サブサンプル割合
最大10個の値を入力します。有効値は0より大きく1以下の数です。
木あたりの最大ターミナルノード数および木の最大深度
木あたりの最大ターミナルノード数または木の最大深度のどちらを評価するかを選択します。通常、どちらの選択も有用なモデルを識別するための合理的な方法であるため、選択は個々の好みにのみ依存します。
最大ターミナル ノード数
最大3個の値を入力します。有効値は2~2000の範囲になります。2の値は交互作用の調査を除外します。
木の最大深度
最大3個の値を入力します。木の最大深さを表すのに有効な値は2~1000です。ルートノードは深さ1に対応します。多くのアプリケーションでは、4から6までの深さで、合理的に良いモデルが得られます。
ノード分割の予測変数の数
最大3個の値を入力します。適格な値は、1から予測変数の総数までです。通常、分析は予測変数の総数を考慮するとうまく機能します。ただし、一部のデータセットには予測変数間の関連性があり、分析で各ノードの予測変数の数が少ないとモデルのパフォーマンスが向上します。
木の数
1~5000の値を指定して、構築する木の最大数を設定します。デフォルト値の300は、通常、ハイパーパラメーター値の評価に有用な結果を提供します。
対象となる1つ以上のモデルが、指定した木の数に近い木の数を持つ場合は、木の数を増やすかどうかを検討します。木の数が最大数に近い場合、木の数を増加するとモデルのパフォーマンスが向上する可能性が高くなります。

MARS®

既存のモデルを選択して、検索からいずれかのモデルの結果を生成します。新しいモデルに適合するハイパーパラメータを指定して、モデルのパフォーマンスを向上させるハイパーパラメータの組み合わせを探します。

既存のモデルを選択する

最適なモデルの種類の検索では、分析によって、検索に含まれる基底関数の数ごとに MARS® モデルが生成されます。リストからモデルを選択し、 をクリックして 結果を表示 そのモデルの結果を生成します。

新しいモデルに合わせてハイパーパラメーターを指定する

をクリックして 結果を表示 、新しいモデルのパラメータを評価します。結果には、最大R2などの最適性基準の最良の値を持つモデルのモデル結果が含まれます。
基底関数の最大数
ほとんどの場合、デフォルト値の30が良好に機能します。30基底関数がデータに対して小さすぎると思われる場合は、より大きな値を検討してください。たとえば、30個を超える予測変数が重要であると思われる場合は、より大きな値を検討します。
30で十分かどうかわからない場合は、最初の結果を確認してください。たとえば、値を大きくすると、解析によって基底関数が追加されるにつれて決定係数の 2 乗値が上昇傾向にある場合に、モデルの適合度が向上する可能性が高くなります。
ノット間の観測値の最小数
MARS® に選択を許可する
分析では、サンプルサイズとモデルの複雑さを使用して、値を自動的に選択します。ほとんどの場合、自動値はうまく機能します。
ユーザー指定 λ
値 1 は、連続するデータ ポイントが基底関数が変化するポイントとして適格であることを示します。値 1 を指定すると、モデル予測を最も迅速に変更できます。より大きな値を使用してより滑らかなモデルを作成し、より一般的な関係を探索します。このような滑らかなモデルは、データの特定の範囲では精度が低下する場合があります。
許可された予測変数の交互作用

指定した順序まで予測変数の交互作用を許可します。交互作用とは、予測変数の効果が他の予測変数の値に依存することを意味します。たとえば、穀物がオーブンで乾燥する速度はオーブン内の時間に依存しますが、時間の影響はオーブンの温度に依存します。時間と温度の変数は相互作用します。

交互作用を許可しない (加法モデル)
予測変数の交互作用を許可しません。この場合、Minitabでは基底関数が相互作用しない加法モデルが使用されます。
オーダー2までのすべての交互作用を許可する
順序は、基底関数に含めることができる異なる予測変数の数を指定します。たとえば、次数 2 は、予測変数の効果が他の 1 つの予測変数の値に依存する可能性があることを示します。次の基底関数は、次数 2 の相互作用の例です。
  • BF1 = 最大(0, X1 − 800)
  • BF2 = max(0, X2 − 50) * BF1

重回帰

選択 重回帰モデルの結果 してクリック 結果を表示 すると、最適なタイプのモデルの検索から最適な重回帰モデルの結果が生成されます。

CART®

選択 CART®モデルの結果 してクリック 結果を表示 すると、最適なタイプのモデルの検索から最適なCART® モデルの結果が生成されます。