このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
連続的およびカテゴリTreeNet® 分類予測変数が多数あるカテゴリ応答の勾配ブースト分類ツリーを生成するために使用します。TreeNet® 分類は、世界有数のデータマイニング研究者であるJerome Friedman,が開発したデータマイニング技術の画期的な進歩です。この柔軟で強力なデータ マイニング ツールは、非常に正確なモデルを非常に高速で一貫して生成することができ、乱雑で不完全なデータに対しても高い許容範囲を実現しています。
たとえば、ある市場調査員は、TreeNet® 分類を使用して、特定の戦略に対する反応率が高い顧客を特定し、その反応率を予測します。
CART® 分類は優れたデータ探索分析ツールであり、重要な予測変数を迅速に特定するためのわかりやすいモデルを提供します。ただし、CART® 分類で最初の探索を行った後 は、必要なフォローアップステップとしてTreeNet® 分類を検討してください。TreeNet® 分類は、数百の小さなツリーで構成される高性能で複雑なモデルを提供します。各ツリーは、モデル全体に少しずつ貢献しています。TreeNet® 分類の結果に基づいて、多くの候補予測変数からカテゴリ応答と重要な予測変数との関係に関する洞察を得ることができ、新しい観測値の応答クラスの確率を高い精度で予測できます。
このTreeNet® 分類解析では、1つおよび 2つの予測値の部分的な依存関係プロットが提供されます。これらのプロットは、主要予測変数の変化が応答値にどのような影響を与えるかを評価するのに役立ちます。したがってこの情報は、最適な計算結果を可能にする設定を制御するのに役立ちます。
TreeNet® 分類分析では、モデルに対して異なるハイパーパラメーターを試す機能も提供されます。学習率とサブサンプル割合は、ハイパーパラメーターの例です。異なる値の探索は、モデルのパフォーマンスを向上させる一般的な方法です。
CART®の方法論の詳細については、Breiman, Friedman, Olshen and Stone (1984)を参照してください。1と2.
適合モデルは、連続およびカテゴリ予測変数が多数あるカテゴリ応答の単一勾配ブースト分類ツリーを生成するために使用します。結果は、最大対数尤度、ROC曲線下の最大面積、または最小誤分類率を持つ学習プロセスのモデルに対するものです。
予測変数の数が多いデータセットの場合、一部の予測変数は他の予測変数よりも応答への効果が少ないので、主要な予測変数を検出を使用して重要でない予測変数をモデルから排除することを検討してください。重要でない予測変数を除去することで、最も重要な予測変数の効果を明らかにし、予測精度を向上させます。このアルゴリズムは、最も重要度の低い予測変数を順次削除し、異なる数の予測変数を持つモデルを比較できる結果を示し、最適な精度基準の値を持つ予測変数セットの結果を生成します。
たとえば、市場調査員は、主要な予測変数を検出を使用して、特定のイニシアチブに対して応答率が高い顧客を効果的にモデル化する500個の予測変数セットから、1ダースほどの予測変数を自動的に識別します。
主要な予測変数を検出はまた、モデルの予測精度に対する各重要な予測変数の効果を定量的に評価するため、最も重要な予測変数を削除することもできます。
適合モデルを実行するには、 を選択します。
主要な予測変数を検出を実行するには、 を選択します。
2値応答変数を使用してパラメトリック回帰モデルを試す場合は、2値ロジスティックモデルの当てはめを使用します。
Random Forests®分類モデルのパフォーマンスを比較するには、Random Forests® 分類を使用します。