Random Forests® 分類におけるゲインチャートの方法と計算式

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

ゲインチャート上の点についての手順は、検証法によって異なります。多項応答変数の場合、Minitabでは、各クラスを順番に事象として扱う複数のチャートが表示されます。

アウトオブバッグ

フォレスト内の特定のツリーに対して、アウトオブバッグデータの行に対するクラス投票は、単一ツリーの行の予測クラスです。アウトオブバッグデータの行の予測クラスは、フォレスト内のすべてのツリーで最も高い投票数を持つクラスです。アウトオブバッグデータの行の予測クラス確率は、クラスの投票数と行の総投票数の比率です。

アウトオブバッグデータの曲線では、グラフ上の各点は、個別の予測クラス確率を表します。最高の事象確率は、チャート上の最初の点で、左端に表示されます。他の確率は降順です。

ゲインチャートのY座標は、パーセントスケールの真陽性率です。真陽性率の計算は、ROC曲線チャートの場合と同じです。チャートのX座標は以下の式となります:

ここで、 は、適合確率がしきい値より大きい行数で、Nは行の合計数です。しきい値の詳細は、Random Forests® 分類の受信者動作特性 (ROC) 曲線チャートの方法と式を参照してください。

別のテストセット

トレーニングセットの場合と同じ手順を使用しますが、テストセットのケースから事象確率を計算します。