TreeNet® 回帰での適合モデルおよび主要な予測変数を検出の概要

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

TreeNet® 回帰は、連続およびカテゴリ予測変数が多数ある連続応答の勾配ブースト回帰ツリーを生成するために使用します。TreeNet® 回帰は、世界有数のデータマイニング研究者であるJerome Friedman,が開発したデータマイニング技術の画期的な進歩です。この柔軟で強力なデータ マイニング ツールは、非常に正確なモデルを非常に高速で一貫して生成することができ、乱雑で不完全なデータに対しても高い許容範囲を実現しています。

たとえば、医学研究者は、TreeNet® 回帰を使用して、特定の治療法に対する反応率が高い患者を特定し、その反応率を予測できます。

CART® 回帰は優れたデータ探索分析ツールであり、重要な予測変数を迅速に特定するためのわかりやすいモデルを提供します。ただし、CART® 回帰で最初の探索を行った後 は、必要なフォローアップステップとしてTreeNet® 回帰を検討してください。TreeNet® 回帰は、数百の小さなツリーで構成される高性能で複雑なモデルを提供します。各ツリーは、モデル全体に少しずつ貢献しています。TreeNet® 回帰の結果に基づいて、多くの予測変数の候補から連続応答および重要な予測変数との関係に関する洞察を得ることができ、新しい観測値の応答を高い精度で予測できます。

このTreeNet® 回帰解析では、1つおよび 2つの予測値の部分的な依存関係プロットが提供されます。これらのプロットは、主要予測変数の変化が応答値にどのような影響を与えるかを評価するのに役立ちます。したがってこの情報は、最適な計算結果を可能にする設定を制御するのに役立ちます。

TreeNet® 回帰分析では、モデルに対して異なるハイパーパラメーターを試す機能も提供されます。学習率とサブサンプル割合は、ハイパーパラメーターの例です。異なる値の探索は、モデルのパフォーマンスを向上させる一般的な方法です。

CART®の方法論の詳細については、Breiman, Friedman, Olshen and Stone (1984)を参照してください。12.

適合モデル

適合モデルは、連続およびカテゴリ予測変数が多数ある連続応答の単一勾配ブースト回帰木モデルを生成するために使用します。結果は、R2の最大値または最小絶対偏差を持つ学習プロセスのモデルに対してのものです。

主要な予測変数を検出

予測変数の数が多いデータセットの場合、一部の予測変数は他の予測変数よりも応答への効果が少ないので、主要な予測変数を検出を使用して重要でない予測変数をモデルから排除することを検討してください。重要でない予測変数を除去することで、最も重要な予測変数の効果を明らかにし、予測精度を向上させます。このアルゴリズムは、最も重要度の低い予測変数を順次削除し、異なる数の予測変数を持つモデルを比較できる結果を示し、最適な精度基準の値を持つ予測変数セットの結果を生成します。

たとえば、化学者は、主要な予測変数を検出を使用して、新しい混合燃料の粘度を効果的にモデル化するために、500個の予測変数セットから1ダースほどの予測変数を自動的に識別します。

主要な予測変数を検出はまた、モデルの予測精度に対する各重要な予測変数の効果を定量的に評価するため、最も重要な予測変数を削除することもできます。

この分析の場所

適合モデルを実行するには、予測分析モジュール > TreeNet®回帰 > 適合モデルを選択します。

主要な予測変数を検出を実行するには、予測分析モジュール > TreeNet®回帰 > 主要な予測変数を検出を選択します。

他の分析を使用する場合

連続応答変数を使用してパラメトリック回帰モデルを試す場合は、回帰モデルの適合を使用します。

Random Forests®回帰モデルのパフォーマンスを比較するには、Random Forests® 回帰を使用します。

1 Breiman, Friedman, Olshen & Stone.(1984).Classification and Regression Trees(分類および回帰ツツリー).Boca Raton, Florida:Chapman & Hall/CRC.
2 H. Zhang and B.H. Singer.(2010).Recursive Partitioning and Applications(再帰的な分配およびその応用). New York, New York: Springer