TreeNet^® 回帰による適合モデルおよび主要な予測変数を検出のハイパーパラメーターの最適化

注

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。

このトピックの内容

最適な木の数
R二乗（%）
平均絶対偏差 (MAD)
学習率

サブサンプル割合
木あたりの最大ターミナルノード数
木の最大深度

結果を使用して、異なる設定のハイパーパラメータでモデルのパフォーマンスを比較します。ハイパーパラメータの調整をクリックして、ハイパーパラメータの追加値を評価します。

最適な木の数

通常、最適な木の数は、各ステップで異なります。最適な木の数がこの分析の木の数の最大値に近い場合、最大値から遠く離れた最適な木の数を持つモデルよりも木の数を増やすと、モデルが改善される可能性が高くなります。改善の可能性が高いと思われる代替モデルを調べることを検討することもできます。

R二乗（%）

R²は、モデルによって説明される応答の変動のパーセントです。 R²はMADに比べ外れ値の影響を受けやすくなります。

二乗誤差損失関数またはフーバー損失関数を使用する場合、表には各モデルの R²の値が含まれます。次の結果は、R²の最大値を持つモデルに対するものです。

平均絶対偏差 (MAD)

平均絶対偏差(MAD)とは、予測値と実測値の間の差の平均絶対値です。MADが小さいほどデータへのモデルの適合度は上がります。MADでは、精度がデータと同じ単位で表されるため、誤差の量を概念化するのに役立ちます。MADはR²に比べ外れ値の影響を受けにくくなります。

絶対偏差損失関数を使用する場合、表には各モデルのMAD値が含まれます。表に続く完全な結果は、MAD値が最小のモデルに対してのものです。

学習率

低学習率は、モデル内の各新しいツリーを高い学習率よりも低く評価し、モデルのツリーを生成する場合があります。学習率が低いモデルでは、トレーニングデータセットを過剰適合する可能性が低くなります。学習率が低いモデルは、一般的に、最適な木の数を見つけるためにより多くの木を使用します。

サブサンプル割合

サブサンプル割合は、分析が各木の構築に使用するデータの割合を示します。

木あたりの最大ターミナルノード数

TreeNet^® 回帰多くの小さなCART®ツリーを強力なモデルに組み合わせています。これらの小さな CART®ツリーの場合、ターミナルノードの最大数または木の最大深度のいずれかを指定できます。より多くのターミナルノードを持つ木は、より複雑な交互作用をモデル化できます。一般に、12を超える値は、モデルに多くのメリットを与えることなく分析を遅くする可能性があります。

木の最大深度

TreeNet^® 回帰多くの小さなCART®ツリーを強力なモデルに組み合わせています。これらの小さな CART®ツリーの場合、ターミナルノードの最大数または木の最大深度のいずれかを指定できます。より深い木では、より複雑な交互作用をモデル化できます。多くのデータセットで4から6の値が適当です。

TreeNet® 回帰による適合モデルおよび主要な予測変数を検出のハイパーパラメーターの最適化

注