TreeNet® 回帰適合モデルおよび主要な予測変数を検出の分析オプションを選択する

以下の分析で、分析オプションは同じです。

予測分析モジュール > TreeNet®回帰 > 適合モデル > オプション

予測分析モジュール > TreeNet®回帰 > 主要な予測変数を検出 > オプション

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

分析オプションを選択します。

損失機能
モデルを作成する損失関数を選択します。いくつかの関数の結果を比較して、応用に最適な選択肢を決定できます。
  • 2乗誤差: 二乗誤差関数はデフォルトの関数です。これは平均ベースの損失関数です。この損失関数は、多くの応用で良好に機能します。
  • 絶対偏差: 絶対偏差関数は、中央値ベースの損失関数です。
  • ヒューバー: ヒューバー関数は、2乗誤差と絶対偏差関数のハイブリッドです。
ヒューバー関数で、切り替え値を指定します。損失関数は、2乗誤差として開始されます。損失関数は、値が切り替え値より小さい限り、2乗誤差のままです。2乗誤差が切り替え値を超える場合、損失関数は絶対偏差になります。絶対偏差が切り替え値より小さくなると、損失関数は再び2乗誤差になります。
木の数
1~5000の値を入力して構築する木の数を設定します。300のデフォルト値は、有用な初期結果を提供します。
最初に選択したモデルが指定した木の数に近い場合は、より良いモデルを探すために木の数を増やすことを検討します。
木あたりの最大ターミナルノード数および木の最大深度
また、木のサイズを制限することもできます。木の大きさを制限するには次のいずれかを選択します。
  • 木あたりの最大ターミナルノード数: 木のターミナルノードの最大数を表す2~2000の値を入力します。通常、デフォルト値6は、計算速度と変数間の交互作用の調査のバランスを最適化します。2の値は交互作用の調査を除外します。
  • 木の最大深度: 2~1000の値を入力して木の最大深さを表します。ルートノードは深さ1に対応します。デフォルトの深さは4です。多くのアプリケーションでは、4から6までの深さで、合理的に良いモデルが得られます。
ターミナルノードで許容される最小ケース数
ターミナルノードのケースの最小数を入力します。たとえば、最小数が3で、ある分岐で3ケース未満のノードが作成される場合、分岐は実行されません。
過剰適合保護
モデルのオーバーフィットを最小限に抑えるには、次のオプションを使用します。
学習率
学習率は、データに最適なモデルを特定するために調整できる、非常に重要な2つのハイパーパラメーターの1つです。
デフォルトでは、トレーニングデータのケース数が1000以下の場合、Minitabでは学習率として0.01が使用されます。1000を超えるケースを持つデータセットの場合、デフォルトの学習率はmax[0.01, 0.1 * min(1.0, N/10000)]です。たとえば、データセットに9000の応答がある場合、学習率は0.09です。
初期モデルでデータが適切に予測されない場合は、学習率を5倍または10倍に増減して、より良いモデルを得ることができるか確認します。
サブサンプル割合
分析の各木を構築するためにランダムに選択する学習データの比率を指定します。通常、0.5の割合が有効に機能します。初期モデルがデータに適合しない場合は、割合をデフォルト値の0.5から0.70以上に増やすことを検討してください。
ノード分割の予測変数の数
各ノード分割について考慮する予測変数の数を指定します。通常、すべてのノードですべての予測変数を考慮すると、分析が適切に機能します。ただし、いくつかのデータセットは、分析が各ノードで予測変数の異なるランダムなサブセットを考慮したときに、モデルパフォーマンスの向上につながる予測変数間の関連性を持っています。このような場合、予測変数の総数の平方根は典型的な開始点です。平方根を使用してモデルを表示した後、合計に対するパーセンテージを持つ予測変数の数を増やすか、より少ない数を指定するかを検討できます。
  • 予測変数の総数: ノードの分割にすべての予測変数を使用する場合に選択します。
  • 予測変数の総数の平方根: ノードの分割に対して予測変数の総数の平方根を使用する場合に選択します。
  • 予測変数の総数のKパーセント、K =: ノードの分割に予測変数のパーセンテージを使用する場合に選択します。
乱数ジェネレータの初期値
乱数生成器の初期値を指定して、サブサンプルと予測変数のサブセットをランダムに選択できます。通常、初期値を変更する必要はありません。結果がランダム選択にどの程度敏感であるかを調べるか、繰り返し分析を行う場合に同じランダム選択を行うために、初期値を変更できます。
重み
ケースの重みを含む列を入力します。この列の行数は、応答列と同じである必要があります。値は0以上である必要があります。Minitabでは、欠損値またはゼロを含む行は分析から除外されます。