2値ロジスティックモデルの適合のモデル要約を求める方法と計算式

目的の方法または計算式を選択してください。

逸脱度R2

逸脱R2は、応答の変動がモデルによって説明される量を示します。通常、R2が大きいほど、データへのモデルの適合度は高くなります。計算式は以下になります。

表記

用語説明
D EError Deviance
DT値Total Deviance

調整済み逸脱度R2

調整済み逸脱度R2は、モデル内の予測変数の数で調整されたR二乗です。予測変数の数が異なるモデルの比較に有用です。計算式は以下になります。

表記

用語説明
R2逸脱度R2
p回帰自由度
Φ1(二項モデル、ポアソンモデルの場合)
DT合計逸脱度

調整済み逸脱度R2の計算結果が負の値になることがありますが、こうしたケースではゼロが表示されます。

赤池情報量基準(AIC)

この統計量を使用して、異なるモデルを比較します。AICが小さいほど、データへのモデルの適合度が上がります。

対数尤度関数は、パラメータを平均に換算して表します。関数の一般形は以下になります。

各寄与度の一般形は以下になります。

各寄与度の具体的な形式はモデルによって変わります。

モデル li
二項
ポアソン

表記

用語説明
p回帰自由度
Lc現在のモデルの対数尤度
yii行目の事象数
mii行目の試行数
i行目の推定平均応答

AICc(補正赤池情報量基準)

AICcは次の場合には計算されません。.

表記

用語説明
pモデルの係数の個数(定係数を含む)
n欠損データを含まないデータ行の数

BIC(ベイズ情報量基準)

表記

用語説明
p定数を含まないモデル内の係数の数
n欠損データを含まないデータ行の数

テストの逸脱R2

テストの逸脱率R2は、モデルが説明するテストデータセットの応答の変動の程度を示します。値が大きいほど、モデルはテストデータに適合します。

計算式

次式は、テストの逸脱R2の計算式を示します。

ここで、次式は誤差の逸脱を表します。

次式は、全体の逸脱を表します。
切片項をがあるモデルの場合、 には、次の定義があります。

切片項のないモデルの場合、 = 0.5となります。

表記

用語説明
N(Test)the number of rows in the test data set
the squared deviance residuals
yithe number of events for the i番目 row in the test data set
mithe number of trials for the i番目 row in the test data set
DE(Test)the error deviance for the test data set
DT(Test)the total deviance for the test data set

ROC曲線下の面積

計算式

曲線下の面積には、積分が使用されます。

ほとんどの場合、この積分は、次の台形の領域の合計に相当します。

ここで、kは個別の事象確率の数であり、(x0,y0) は点 (0, 0) です。

たとえば、ROC曲線上に次の座標をもつ4つの異なる事象確率があるとします。
x (偽陽性率) y (真陽性率)
0.0923 0.3051
0.4154 0.7288
0.7538 0.9322
1 1
次に、ROC曲線下の面積は、次の計算によって与えられます。

表記

用語説明
TRP true positive rate
FPR false positive rate
TPtrue positive, events that were correctly assessed
P number of actual positive events
FPtrue negative, nonevents that were correctly assessed
N number of actual negative events
FNRfalse negative rate
TNRtrue negative rate
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください