このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
Random Forests®モデルで使用できる合計予測変数。合計は、指定した連続予測変数とカテゴリ予測変数の総数です。
Random Forests®モデルの重要な予測変数の数。重要な予測変数には、0.0 より大きい重要度スコアがあります。相対変数重要度グラフを使用して、相対変数の重要度の順序を表示することができます。たとえば、モデルで20個の予測変数のうち10個が重要であるとすると、相対変数重要度グラフは重要な順に変数を表示します。
R2は、モデルによって説明される応答の変動のパーセントです。
R2を使用して、モデルがデータにどの程度適合するかを判断します。R2値が高いほど、モデルが良好にデータに適合します。R2は常に0%から100%の間です。
Random Forests®は、アウトオブバッグデータを使用して R2を計算しますが、モデルに適合しないため、モデルのオーバーフィットは問題ではありません。
二乗平均平方根誤差 (RMSE) は、モデルの正確性を評価します。外れ値は、MADやMAPEに対してよりも、RMSEに大きな影響を与えます。
さまざまなモデルの適合値を比較するためにを使用します。値が小さいほど、適合性が高いことを示します。
平均二乗誤差 (MSE) は、モデルの正確性を評価します。外れ値は、MADやMAPEに対してよりも、MSEに大きな影響を与えます。
さまざまなモデルの適合値を比較するためにを使用します。値が小さいほど、適合性が高いことを示します。
平均絶対偏差(MAD)は、データと同じ単位で正確性を表し、誤差の量を概念化するのに役立つます。外れ値は、R2、RMSE、およびMSEに対してよりも、MADに対する影響が少ないです。
さまざまなモデルの適合値を比較するためにを使用します。値が小さいほど、適合性が高いことを示します。
平均絶対パーセント誤差 (MAPE) は、応答値のサイズに対するエラーのサイズを表します。したがって、同じサイズのエラーでは、応答変数の値が小さくなるほどMAPE値が大きくなります。MAPEはパーセント値であるため、他の精度の測度を表す統計量よりも容易に理解できます。たとえば、MAPE が平均で0.05の場合、適合誤差とすべてのケースの実際の値の平均比率は5%になります。外れ値は、R2、RMSE、およびMSEに対してよりも、MAPEに対する影響が少ないです。
しかし、モデルがデータに良好に適合しているように見えても、非常に大きなMAPE値が表示されることがあります。適合値と実応答値のプロットを調べて、データ値が0に近いかどうかを調べます。MAPEは絶対誤差を実際のデータで割るため、0に近い値はMAPE を大きく増大させる可能性があります。
さまざまなモデルの適合値を比較するためにを使用します。値が小さいほど、適合性が高いことを示します。