ハイパーパラメータの調整をクリックします。 を実行します。結果の
TreeNet®モデルのパフォーマンスは、一般に、学習率、サブサンプル割合、およびモデルを形成する個々の木の複雑さの値の影響を強く受けます。モデルの結果で、ハイパーパラメータの調整をクリックすると、これらの複数のハイパーパラメーターの値を評価して、R2の最大値などの精度基準の最適値を生成する組み合わせを確認できます。これらのハイパーパラメーターの値が良いほど予測精度が大幅に向上する可能性があるため、様々な値で試すことは分析の一般的なステップです。
モデルに含まれる木の数を調整することもできます。一般に、300本の木でハイパーパラメーターの値を十分に区別できます。一般に、対象となる1つ以上のモデルで最適な木の数が木の最大数に近づくと、木の数が増えます。木の数が最大数に近い場合、木の数を増加するとモデルのパフォーマンスが向上する可能性が高くなります。
評価するハイパーパラメーターのそれぞれに対して値を1つ以上指定します。分析でハイパーパラメーターを評価して、精度基準の最適値を使用して組み合わせを検索します。ハイパーパラメーターに値を入力しなかった場合、評価では、結果のモデルからそのハイパーパラメーターの値が使用されます。応答が2値で、元のモデルでサンプルに対する事象と非事象の比率が指定されている場合、評価では常に元のモデルの比率が使用されます。
最大10個の値を入力します。有効値は0.0001~1の範囲になります。完全なパラメーターの組み合わせを評価するを選択しない限り、学習率の評価が最初です。評価が最初に行われる場合、学習率の評価では学習率とサブサンプル割合の最小値が使用されます。
最大10個の値を入力します。有効値は0より大きく1以下の数です。完全なパラメーターの組み合わせを評価するを選択しない限り、サブサンプルの評価が2番目です。評価が2番目に行われる場合、サブサンプルの割合の評価では、学習率に対して見つかった分析の最適値と、サブサンプル割合の最小値が使用されます。
元のモデルが2値応答のサンプリング対象となる事象と非事象の比率を指定するとサブサンプル割合が無効になります。
1~5000の値を入力して木の最大数を設定します。デフォルト値の300は、通常、ハイパーパラメーター値の評価に有用な結果を提供します。
対象となる1つ以上のモデルが、指定した木の数に近い木の数を持つ場合は、木の数を増やすかどうかを検討します。木の数が最大数に近い場合、木の数を増加するとモデルのパフォーマンスが向上する可能性が高くなります。
この例では、パラメーターの組み合わせの完全なセットを評価しない分析で、評価表に8つのモデルが含まれています。すべてのパラメーターの組み合わせ分析では3 × 3 × 2 = 18通りの組み合わせがあり、計算に時間がかかります。
検査する値を指定したら、 結果を表示をクリックします。新しい結果セットでは、ハイパーパラメーターの組み合わせの精度基準と、最適な精度基準の値を持つモデルの結果とを比較する表が生成されます。
Minitabでは、元のモデルに対するものと同じ表とグラフが新しいモデルでも再作成されます。新しいモデルの表とグラフは、新しい結果セットに含まれています。保存は元の分析と同じです。格納列は同じワークシート内となります。たとえば、元の分析で適合値が「Fit」という列に格納されている場合、新しい分析では空の列に「Fit_1」のタイトルが付けられ、適合値が格納されます。