二元 Logistic 回归诊断

在任意建模过程后,您通常会验证模型。统计 > 回归 > 二元 Logistic 回归 > 拟合二元 Logistic 模型具有一系列诊断图、拟合优度检验及其他诊断度量标准,可用于验证模型。残差和其他诊断统计量有助于发现以下潜在问题:
  • 没有可接受拟合值的因子/协变量模式
  • 对参数估计值有较强效应的因子/协变量模式
  • 杠杆率较大的因子/协变量模式

Minitab 为这些潜在问题分别提供了多个不同的选项,详见下表。Hosmer 和 Lemeshow1 指出,您可以同时解释这些诊断以了解模型存在的所有潜在问题。

潜在问题 诊断统计量 统计量定义
没有可接受拟合值的因子/协变量模式 Pearson 残差 实际观测值与预测观测值之间的差异
标准化 Pearson 残差 实际观测值与预测观测值之间的差异,但经过标准化后 σ = 1
残差偏差 残差偏差,偏差卡方的一个分量
Delta 卡方 删除第 j 个因子/协变量模式后,Pearson 卡方所发生的变化
Delta 偏差 删除第 j 个因子/协变量模式后,偏差所发生的变化
对参数估计值有较强效应的因子/协变量模式 通过 Pearson 残差计算的 Delta beta 删除第 j 个因子/协变量模式后,系数发生的变化
通过标准化 Pearson 残差计算的 Delta beta 删除第 j 个因子/协变量模式后,系数发生的变化
杠杆率较大的因子/协变量模式 杠杆率 (Hi) 第 j 个因子/协变量模式的杠杆率,用于度量预测变量值的异常程度

残差图使您能够直观地了解某些诊断。您也可以存储和绘制其他诊断。Delta 卡方和 delta 偏差对于确定拟合模型不佳的因子/协变量模式非常有用。Delta beta 统计量对于确定对参数估计值有较强效应的因子/协变量模式非常有用。通常情况下,您可以根据估计事件概率或杠杆率来绘制这些 delta 统计量。估计事件概率就是给定数据和模型条件下的事件概率。杠杆率用于评估预测变量值的异常程度。您可以使用 Minitab 的图形笔刷功能来标识图上的点。

1 Hosmer D.W. 和 Lemeshow S. (2000)。Applied Logistic Regression(应用的 Logistic 回归)。第 2 版。John Wiley and Sons, Inc.