拟合二元 Logistic 模型中诊断度量标准的方法和公式

请选择您所选的方法或公式。

Pearson 残差

Pearson 卡方的元素,可用于检测未能良好拟合的因子/协变量模式。Minitab 会存储第 i 个因子/协变量模式的 Pearson 残差。公式为:

表示法

说明
yii 个因子/协变量模式的响应值
i 个因子/协变量模式的拟合值
V在 处的模型方差函数

方差函数取决于模型:

模型 方差函数
二项
Poisson

标准化和删后 Pearson 残差

用于检测未能良好拟合的因子/协变量模式。Minitab 会存储第 i 个因子/协变量模式的标准化 Pearson 残差。删后 Pearson 残差又称似然比 Pearson 残差。对于删后 Pearson 残差,Minitab 会计算 Pregibon 中描述的一步近似。1 该近似等于标准化 Pearson 残差。公式为:

表示法

说明
i 个因子/协变量模式的 Pearson 残差
1,用于二项和 Poisson 模型
i 个因子/协变量模式的杠杆率

标准化 Pearson 残差并验证

对于验证数据,标准化 Pearson 残差公式的分母将加上杠杆率,而不是减去杠杆率。

公式

表示法

说明
the Pearson residual for the i(序号) validation row
1, for the binomial and Poisson models
the leverage for the i(序号) validation row

偏差量残差

偏差量残差基于模型偏差,并且适用于标识未能良好拟合的因子/协变量模式。模型偏差是基于对数似然函数的拟合优度统计量。为第 i 个因子/协变量模式定义的偏差量残差为:

表示法

说明
yi i 个因子/协变量模式的响应值
i 个因子/协变量模式的拟合值
i 个因子/协变量模式的偏差

标准化偏差量残差

标准化偏差量残差可用于标识异常值。公式为:

表示法

说明
rD,ii 个因子/协变量模式的偏差量残差
hii 个因子/协变量模式的杠杆率

标准化残差偏差并验证

对于验证数据,标准化残差偏差公式的分母将加上杠杆率,而不是减去杠杆率。

公式

表示法

说明
rD,iThe deviance residual for the i(序号) validation row
hiThe leverage for the i(序号) validation row

删后偏差量残差

删后偏差量残差可度量由于数据中缺失第 i 个案例而导致的偏差变化。删后偏差量残差又称似然比率偏差量残差。对于删后偏差量残差,Minitab 会根据 Pregibon 一步近似法1计算一步近似值。公式如下:

表示法

说明
yii 个因子/协变量模式的响应值
i 个因子/协变量模式的拟合值
hi第 i 个因子/协变量模式的杠杆率
r'D,ii 个因子/协变量模式的标准化偏差量残差
r'P,ii 个因子/协变量模式的标准化 Pearson 残差

1. Pregibon, D. (1981)。“Logistic Regression Diagnostics”(Logistic 回归诊断), The Annals of Statistics(统计学年刊),第 9 卷第 4 期,第 705 至 724 页。

Delta 卡方

Minitab 会计算由于删除所有包含第 j 个因子/协变量模式的观测值而导致的 Pearson 卡方变化。Minitab 会针对数据中的每个可区分因子/协变量模式存储一个 Delta 卡方值。您可以使用 Delta 卡方检测未能良好拟合的因子/协变量模式。Delta 卡方的公式为:

公式

表示法

说明
hj 杠杆率
rj Pearson 残差

Delta 偏差

Minitab 会通过删除所有包含第 j 个因子/协变量模式的观测值来计算偏差统计量变化。Minitab 会针对数据中的每个可区分因子/协变量模式存储一个值。您可以使用 Delta 偏差检测未能良好拟合的因子/协变量模式。偏差统计量变化为:

表示法

说明
hj杠杆率
rjPearson 残差
dj偏差量残差

Delta beta(标准化)

Minitab 会通过删除所有包含第 j 个因子/协变量模式的观测值来计算该变化。会针对数据中的每个可区分因子/协变量模式存储一个值。您可以使用标准化 delta β 来检测严重影响系数估计值的因子/协变量模式。该值基于标准化 Pearson 残差。

公式

表示法

说明
hj 杠杆率
rs j 标准化 Pearson 残差

Delta beta

Minitab 会通过删除所有包含第 j 个因子/协变量模式的观测值来计算该变化。会针对数据中的每个可区分因子/协变量模式存储一个值。您可以使用 Delta β 来检测严重影响系数估计值的因子/协变量模式。该值基于 Pearson 残差。

公式

表示法

说明
hj 杠杆率
rj Pearson 残差

杠杆率

杠杆率是广义帽子矩阵的对角线元素。杠杆率可用于检测可能对结果有显著影响的因子/协变量模式。

公式

表示法

说明
wj 与系数拟合的权重矩阵的第 j 个对角线元素
xj设计矩阵的第 j
X设计矩阵
X'x 的转置
W系数估计值的权重矩阵

杠杆率并验证

表示法

说明
wi the internal weight for the i(序号) validation row
xithe row of the design matrix for the predictors in the i(序号) validation row
Xthe design matrix for the training data set
X'the transpose of X
Wthe diagonal matrix of internal weights for the training data set

Cook 距离

Minitab 计算 Cook 距离的近似值。

公式

表示法

说明
hii 个因子/协变量模式的杠杆率
i 个因子/协变量模式的标准化 Pearson 残差
p回归自由度

DFITS

度量一次删除对拟合值的影响。DFITS 值较大的观测值可能是异常值。Minitab 会计算 DFITS 的近似值。

公式

表示法

说明
hi数据点的杠杆率
数据点的删后 Pearson 残差

方差膨胀因子 (VIF)

要计算 VIF,请对相应预测变量和剩余的预测变量执行加权回归。加权矩阵由 McCullagh 和 Nelder1 得出,可用于估计系数。在这种情况下,VIF 公式与线性回归公式等效。例如,对于预测变量 xj,VIF 的公式为:

表示法

说明
xj 的判定系数作为响应变量,将模型中的其他项作为预测变量

1. P. McCullagh 和 J. A. Nelder (1989),Generalized Linear Models(广义线性模型),第 2 版,出版机构为伦敦的 Chapman & Hall/CRC。