ベストモデルの検出(連続応答)ハイパーパラメーターの最適化

このコマンドは、で使用できます予測分析モジュールモジュールをアクティブにする方法については、ここをクリックしてください

方法表の定義と解釈について解説します。

を使用してモデルを作成した後、 ベストモデルの検出(連続応答)クリック 代替モデルの選択 して他のモデルを探索できます。ランダム フォレスト ® モデルを選択した場合、1 つのオプションとして、新しいモデルに適合するハイパーパラメーターを指定します。ハイパーパラメーターを指定した場合、結果には「ハイパーパラメーターの最適化」テーブルが含まれます。この表では、ハイパーパラメーターの組み合わせを比較します。「ハイパーパラメーターの最適化」表に続く結果は、最適度基準の最適値 (最大 R 2 など) を持つモデルに対して行われますR2

R乗

R2は、モデルによって説明される応答の変動のパーセントです。

解釈

R2を使用して、モデルがデータにどの程度適合するかを判断します。R2値が高いほど、モデルが良好にデータに適合します。R2は常に0%から100%の間です。

さまざまなR2値の意味をグラフィカルに示すことができます。最初のプロットは、応答における85.5%の変動を説明する単回帰モデルを図示しています。2つ目のプロットは、応答における22.6%の変動を説明するモデルを図示しています。モデルによって説明される変動が多いほど、データ点が適合値に近づきます。理論上、モデルが変動の100%を説明できる場合、適合値は常に観測値と等しく、すべてのデータ点はy = x 線上にあるでしょう。

Random Forests®は、アウトオブバッグデータを使用して R2を計算しますが、モデルに適合しないため、モデルのオーバーフィットは問題ではありません。

平均絶対偏差 (MAD)

平均絶対偏差(MAD)は、データと同じ単位で正確性を表し、誤差の量を概念化するのに役立つます。MADはR2に比べ外れ値の影響を受けにくくなります。

解釈

さまざまなモデルの適合値を比較するためにを使用します。値が小さいほど、適合性が高いことを示します。

ノード分割の予測値カウント

この行は、考慮する予測変数の数の選択を示します。

最小内部ノードのサイズ

最小内部ノードのサイズとは、ノードに属することができ、さらに多くのノードに分割できるケースの最小数を示します。

ブートストラップサンプルの数

ブートストラップサンプルの数は、解析のツリー数を示します。