このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
フォレスト内の特定のツリーに対して、アウトオブバッグデータの行に対するクラス投票は、単一ツリーの行の予測クラスです。アウトオブバッグデータの行の予測クラスは、フォレスト内のすべてのツリーで最も高い投票数を持つクラスです。アウトオブバッグデータの行の予測クラス確率は、クラスの投票数と行の総投票数の比率です。
アウトオブバッグデータの曲線では、グラフ上の各点は、個別の予測クラス確率を表します。最高の事象確率は、チャート上の最初の点で、左端に表示されます。他の確率は降順です。
次の手順に従って、グラフのx座標とy座標を見つけます。
たとえば、次の表に、2つの2水準のカテゴリ予測変数がある単純なモデルを要約するとします。これらの予測変数は、小数点以下2桁に丸められた4つの異なる事象確率を示します。
A:順序 | B:予測変数1 | C:予測変数2 | D:事象数 | E:非事象数 | F:試行回数 | G:しきい値(適合事象確率) |
---|---|---|---|---|---|---|
1 | 1 | 1 | 18 | 12 | 30 | 0.60 |
2 | 1 | 2 | 25 | 42 | 67 | 0.37 |
3 | 2 | 1 | 12 | 44 | 56 | 0.21 |
4 | 2 | 2 | 4 | 32 | 36 | 0.11 |
合計 | 59 | 130 | 189 |
次に、対応する4つの表と、それぞれの偽陽性率と真陽性率を小数点以下2桁で示します。
予測値 | |||
---|---|---|---|
事象 | 非事象 | ||
観測 | 事象 | 18 | 41 |
非事象 | 12 | 118 |
予測値 | |||
---|---|---|---|
事象 | 非事象 | ||
観測 | 事象 | 43 | 16 |
非事象 | 54 | 76 |
予測値 | |||
---|---|---|---|
事象 | 非事象 | ||
観測 | 事象 | 55 | 4 |
非事象 | 98 | 32 |
予測値 | |||
---|---|---|---|
事象 | 非事象 | ||
観測 | 事象 | 59 | 0 |
非事象 | 130 | 0 |
アウトオブバッグの場合と同じ手順を使用しますが、テストセットのケースから事象確率を計算します。