このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
次に、予測変数の重要度スコアは、すべての木でモデル改善スコアの合計と等しくなります。
ここで、
用語 | 説明 |
---|---|
N | 完全なデータまたはトレーニングデータセットのサンプルサイズ |
wi | 完全なデータセットまたはトレーニングデータセット内のi番目の観測の重み |
yi | 完全またはトレーニングデータセットに対するi番目の応答値、事象の場合は1、それ以外の場合は0 |
完全なデータセットまたはトレーニングデータセット内のi番目の行の事象の予測確率 | |
モデルからの適合値 |
ここで、
用語 | 説明 |
---|---|
N | 完全なデータまたはトレーニングデータのサンプルサイズ |
nk | 分割kのサンプルサイズ |
wi, k | 分割kのi番目の観測値の重み |
yi, k | 分割kにおけるケースiの2値応答値。事象クラスの場合はyi, k = 1、それ以外の場合は0。 |
分割kにおけるケースiの予測確率。予測される確率は、分割kにおけるデータを使用しないモデルからのものです。 | |
分割kにおけるケースiの適合値。適合値は、分割kにおけるデータを使用しないモデルからのものです。 |
ここで、
用語 | 説明 |
---|---|
nTest | テストデータセットのサンプルサイズ |
wi, Test | テストデータセット内のi番目の観測値の重み |
yi, Test | テストデータセットの分割kにおけるケースiの2値応答値。事象クラスの場合はyi, k = 1、それ以外の場合は0。 |
テストセット内のケース i の予測確率 | |
テストデータセット内のケースiの適合値 |
ここで、
用語 | 説明 |
---|---|
完全なデータまたはトレーニングデータセットのサンプルサイズ | |
wi | 完全なデータセットまたはトレーニングデータセット内のi番目の観測の重み |
yi, q | i番目の それ以外の場合は 0 |
完全なデータセットまたはトレーニングデータセット内のi番目における応答の、 q番目の水準の予測確率 | |
i番目の行のq番目の木の系列からの適合値、これは応答のq番目の水準の予測確率を計算するために使用されます。 |
ここで、
用語 | 説明 |
---|---|
N | トレーニングデータのサンプルサイズ |
nk | 分割kのサンプルサイズ |
wi, k | 分割kのi番目の観測値の重み |
yi, k, q | 分割kにおけるケースiのi番目の応答値、 それ以外の場合は 0。 |
分割kにおけるi番目における応答の、 q番目の水準の予測確率予測される確率は、分割kにおけるデータを使用しないモデルからのものです。 | |
分割kにおけるi番目の行のq番目の木の系列からの適合値、これは応答のq番目の水準の予測確率を計算するために使用されます。適合値は、分割kにおけるデータを使用しないモデルからのものです。 |
ここで、
用語 | 説明 |
---|---|
nTest | テストデータのサンプルサイズ |
wi, Test | テストデータ内のi番目の観測値の重み |
yi, Test, q | テストデータセットにおけるケースiのi番目の応答値、 それ以外の場合は 0。 |
テストデータのi番目における応答の、q番目の水準の予測確率。予測確率は、テストデータを使用しないモデルからのものです。 | |
テストデータのi番目の行のq番目の木の系列からの適合値、これは応答のq番目の水準の予測確率を計算するために使用されます。予測確率は、テストデータを使用しないモデルからのものです。 |
ここで、kは個別の事象確率の数であり、(x0,y0) は点 (0, 0) です。
テストデータセットまたは交差検証データから曲線の面積を計算するには、対応する曲線の点を使用します。
用語 | 説明 |
---|---|
TPR | 真陽性率 |
FPR | 偽陽性率 |
TP | 真陽性、正しく評価された事象 |
FN | 偽陰性、誤って評価された事象 |
P | 実際の正の事象の数 |
FP | 偽陽性、誤って評価された非事象 |
N | 実際の負の事象の数 |
FNR | 偽陰性率 |
TNR | 真陰性率 |
x (偽陽性率) | y (真陽性率) |
---|---|
0.0923 | 0.3051 |
0.4154 | 0.7288 |
0.7538 | 0.9322 |
1 | 1 |
次の区間は、信頼区間の上限と下限を示します。
ROC曲線下の面積の標準誤差の計算()はSalford Predictive Modeler®からのものです。ROC曲線下の面積の分散の推定に関する一般的な情報は、次の参考資料を参照してください。
Engelmann, B. (2011).Measures of a ratings discriminative power: Applications and limitations.In B. Engelmann & R. Rauhmeier (Eds.), The Basel II Risk Parameters: Estimation, Validation, Stress Testing - With Applications to Loan Risk Management (2nd ed.) Heidelberg; New York: Springer。doi:10.1007/978-3-642-16114-8
Cortes, C. and Mohri, M. (2005).Confidence intervals for the area under the ROC curve.Advances in neural information processing systems, 305-312.
Feng, D., Cortese, G., & Baumgartner, R. (2017).A comparison of confidence/credible interval methods for the area under the ROC curve for continuous diagnostic tests with small sample size.Statistical Methods in Medical Research, 26(6), 2603-2621. doi:10.1177/0962280215602040
用語 | 説明 |
---|---|
A | ROC曲線下の面積 |
標準正規分布の0.975百分位数 |
累積リフトの一般的な計算を表示するには、TreeNet® 分類による適合モデルおよび主要な予測変数を検出のリフトチャートの方法と計算式を参照してください。
重み付きの場合、カウント数の代わりに重み付きカウント数を使用します。
K分割交差検証の場合、誤分類カウント数は、各分割がテストデータセットである場合の誤分類の合計です。
テストデータセットを使用した検証の場合、誤分類カウント数はテストデータセット内の誤分類の合計であり、合計カウント数はテストデータセットの値です。