このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
TreeNet®モデルは、単一分類または回帰木よりもさらに正確でオーバーフィットに対する耐性を備えた分類と回帰の問題を解決するためのアプローチです。プロセスの広範な一般的な説明は、最初のモデルとして小さな回帰木から始めることです。その木から、次の回帰木の応答変数となるデータのすべての行の残差が表示されます。次に、最初の木の残差を予測し、結果として得られる残差を計算するために、別の小さな回帰木を構築します。検証法を使用して、最小予測誤差を持つ最適な木の数がで特定されるまでこのシーケンスを繰り返します。木の結果のシーケンスは、TreeNet® 分類モデルになります。
分類の場合、2値応答を使用した分析と多項応答を使用した分析に、さらに数学的な詳細を追加できます。
ここで、 はイベントの数とは非事象の数。
入力 | 記号 |
---|---|
学習率 | |
サンプル率 | |
ツリーあたりの終端ノードの最大数 | |
木の数 |
ここで
および は、トレーニングデータ内の予測値の i番目の行を表すベクトルです。
用語 | 説明 |
---|---|
木jにおけるターミナルノードmの事象数 | |
木jにおけるターミナルノードmのケース数 | |
ここで、は、応答値が k の場合のケースの数です。Nはトレーニングデータ内の行数です。
入力 | 記号 |
---|---|
学習率 | |
サンプル率 | |
ツリーあたりの終端ノードの最大数 | |
木の数 |
適合値から確率の計算は、これらの木の依存性を表します。それ以外の場合、このプロセスは2値の場合とほぼ同じです。
ここで、
およびは、トレーニングデータセット内の予測値の i番目の行を表すベクトルです。
ここで、
用語 | 説明 |
---|---|
木jにおけるターミナルノードmの結果kのケース数 | |
木jにおけるターミナルノードmのケース数 | |
木のすべてのケースに対する |