Random Forests® 分類のモデル要約表

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

モデル要約表の定義と解釈について理解してください。テストセットによる検証をアウトオブバッグデータを使用した検証に追加すると、両方の検証法の結果が表示されます。

合計予測変数

Random Forests®モデルで使用できる合計予測変数。合計は、指定した連続予測変数とカテゴリ予測変数の総数です。

重要な予測変数

Random Forests®モデルの重要な予測変数の数。重要な予測変数には、0 より大きい重要度スコアがあります。相対変数重要度グラフを使用して、相対変数の重要度の順序を表示することができます。たとえば、モデルで20個の予測変数のうち10個が重要であるとすると、相対変数重要度グラフは重要な順に変数を表示します。

平均対数尤度

応答が2値の場合、負の対数尤度の平均が計算されます。異なるモデルからの平均対数尤度値を比較して、最適なモデルを決定します。この統計を使用して、CART® 分類およびTreeNet® 分類などの他のコマンドのモデルを比較することもできます。平均対数尤度の値が低いほど、適合性が高いことを示します。

ROC曲線下の面積

ROC曲線は、検出力とも呼ばれる真陽性率 (TPR) をy軸にプロットします。ROC曲線は、第1種の過誤とも呼ばれる偽陽性率 (FPR) をx軸にプロットします。ROC曲線下の面積は、分類木が適切な分類器であるかどうかを示します。

分類木の場合、ROC曲線下の面積の通常範囲は0.5から1です。値が大きいほど、分類モデルが適切であることを示します。モデルがクラスを完全に分離できる場合、曲線下の面積は1です。モデルがランダムな割り当てよりも良くクラスを分離できない場合、曲線下の面積は0.5です。

リフト

応答が2値の場合、Minitabはリフトを表示します。リフトは、正しい分類の可能性が最も高い、データの10%の累積リフトです。

リフトは、目的応答を平均応答で割った比率を表します。リフトが1より大きい場合、あるデータの区分は予測よりも大きい応答を有します。

誤分類率

誤分類率は、モデルがイベントと非イベントを正確に分類する頻度を示します。値が小さいほど、パフォーマンスが高いことを示します。