拟合二元 Logistic 模型中模型汇总的方法和公式

请选择您所选的方法或公式。

偏差 R2

偏差 R2 表示响应变量中由模型解释的变异量。R2 越大,模型与数据拟合得越好。公式为:

表示法

说明
DEError Deviance
DTTotal Deviance

调整的偏差 R2

调整的偏差 R2 可以说明模型中预测变量的数量,并且可用于比较具有不同预测变量数量的模型。公式为:

表示法

说明
R2偏差 R2
p回归自由度
Φ1,用于二项和 Poisson 模型
DT总偏差

尽管在计算调整的偏差 R2 时可能会产生负值,但 Minitab 将针对这些情况显示零。

Akaike 信息准则 (AIC)

使用此统计量比较不同模型。AIC 越小,模型与数据拟合得越好。

根据平均值参数化对数似然函数。函数的一般形式如下:

个体贡献的一般形式如下:

个体贡献的特定形式取决于模型。

模型 li
二项
Poisson

表示法

说明
p回归自由度
Lc当前模型的对数似然
yii 行的事件数
mii 行的试验数
i 行的估计均值响应

AICc(Akaike 更正的信息标准)

在满足以下条件时不计算 AICc:.

表示法

说明
p模型中系数的个数,包括常量系数
n具有非缺失数据的行的数量

BIC(Bayesian 信息标准)

表示法

说明
p模型中的系数,不包括常量系数
n具有非缺失数据的行的数量

检验偏差 R2

检验偏差 R2 指示模型解释的检验数据集响应中的变异程度。值越高,模型与检验数据的拟合度越高。

公式

以下方程给出了检验偏差 R2 的公式:

其中,以下方程表示误差偏差:

以下方程表示总偏差:
对于具有截距项的模型, 具有以下定义:

对于没有截距项的模型, = 0.5。

表示法

说明
N(Test)the number of rows in the test data set
the squared deviance residuals
yithe number of events for the i(序号) row in the test data set
mithe number of trials for the i(序号) row in the test data set
DE(Test)the error deviance for the test data set
DT(Test)the total deviance for the test data set

ROC 曲线下面积

公式

对于曲线下面积,Minitab 使用积分。

大多数情况下,此积分等于以下梯形面积的总和:

其中 k 是可区分事件概率的数量,(x0, y0) 是点 (0, 0)。

例如,假设在 ROC 曲线上有如下坐标的四个可区分事件概率:
x(假阳率) y(真阳率)
0.0923 0.3051
0.4154 0.7288
0.7538 0.9322
1 1
然后,通过以下计算给出 ROC 曲线下面积:

表示法

说明
TRP true positive rate
FPR false positive rate
TPtrue positive, events that were correctly assessed
P number of actual positive events
FPtrue negative, nonevents that were correctly assessed
N number of actual negative events
FNRfalse negative rate
TNRtrue negative rate
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策