拟合二元 Logistic 模型的拟合优度检验

在拟合优度检验表中查找每个统计量的定义和解释指导。

偏差拟合优度检验

偏差优度拟合检验会评估当前模型和全模型之间的差异。

解释

使用拟合优度检验确定预测概率是否以二项分布无法预测的方式偏离观测概率。如果拟合优度检验的 P 值低于您所选的显著性水平,则预测概率以二项分布无法预测的方式偏离观测概率。此列表提供偏离的常见原因:
  • 不正确的链接函数
  • 忽略了模型中变量的高阶项
  • 忽略了模型中不存在的预测变量
  • 过度离散

如果偏离在统计上显著,则您可以尝试另一种链接函数或更改模型中的项。

数据在工作表中的排列方式以及每行是存在一个还是多个试验会影响很多拟合优度统计量。与每行有多个试验的数据相比,排列后每行只有一个试验的数据的偏差检验往往具有较低的 p 值,并且该值通常随着每行试验数的减少而减小。

Hosmer-Lemeshow 检验与数据格式无关。如果数据每行的试验数较少,则在检验模型与数据的拟合优度方面,Hosmer-Lemeshow 检验更为可靠。 有关更多信息,请转到数据格式对二元 Logistic 回归中拟合优度的影响

Pearson 拟合优度检验

Pearson 优度拟合检验会评估当前模型和全模型之间的差异。

解释

使用拟合优度检验确定预测概率是否以二项分布无法预测的方式偏离观测概率。如果拟合优度检验的 P 值低于您所选的显著性水平,则预测概率以二项分布无法预测的方式偏离观测概率。此列表提供偏离的常见原因:
  • 不正确的链接函数
  • 忽略了模型中变量的高阶项
  • 忽略了模型中不存在的预测变量
  • 过度离散

如果偏离在统计上显著,则您可以尝试另一种链接函数或更改模型中的项。

数据在工作表中的排列方式以及每行是存在一个还是多个试验会影响很多拟合优度统计量。如果数据中每行事件的预计数量较小, 则 Pearson 检验使用的卡方分布近似不准确。因此,如果数据为每行一个试验的格式,则 Pearson 拟合优度检验也不准确。

Hosmer-Lemeshow 检验与数据格式无关。如果数据每行的试验数较少,则在检验模型与数据的拟合优度方面,Hosmer-Lemeshow 检验更为可靠。 有关更多信息,请转到数据格式对二元 Logistic 回归中拟合优度的影响

Hosmer-Lemeshow

Hosmer-Lemeshow 优度拟合检验会比较事件和非事件的实测频率和预计频率,以便评估模型拟合数据的优度。

解释

使用拟合优度检验确定预测概率是否以二项分布无法预测的方式偏离观测概率。如果拟合优度检验的 P 值低于您所选的显著性水平,则预测概率以二项分布无法预测的方式偏离观测概率。此列表提供偏离的常见原因:
  • 不正确的链接函数
  • 忽略了模型中变量的高阶项
  • 忽略了模型中不存在的预测变量
  • 过度离散

如果偏离在统计上显著,则您可以尝试另一种链接函数或更改模型中的项。

与其他拟合优度检验一样,Hosmer-Lemeshow 检验与数据中每行的试验数无关。如果数据每行的试验数较少,则在检验模型与数据的拟合优度方面,Hosmer-Lemeshow 检验更为可靠。

Hosmer-Lemeshow 检验的观测和预期频率

该模型可以预测 Hosmer-Lemeshow 的预期频率。

解释

使用 Hosmer-Lemeshow 检验的观测和预期频率来描述模型对数据的拟合优度或查找拟合效果不佳的区域。

例如,具有项 X 的模型可以生成 P 值较小的拟合优度检验,这表示模型与数据的拟合效果不佳。在观测和预期频率表中,当事件的概率介于 0.32 到 0.325 之间时,除了第 4 组之外的所有组的超过 10 个事件的预期值都不同。

当模型包括 X 和 X*X 时,拟合优度检验的 P 值较大。这些数据无法提供估计概率以二项分布无法预测的方式偏离观测概率的证据。在第 4 组中,观测和预期事件数之间的差异最大。该差值约为 7。

带 X 的型号

系数

系数系数标准误Z 值P 值方差膨胀因子
常量-0.8000.167-4.790.000 
X0.000920.002710.340.7351.00

拟合优度检验

检验自由度卡方P 值
偏差378.500.000
Pearson374.960.000
Hosmer-Lemeshow374.960.000

Hosmer-Lemeshow 检验的观测频率和预期频率



事件非事件
事件概率范围观测期望观测期望
1(0.000, 0.310)1031.09069.0
2(0.310, 0.315)4031.56068.5
3(0.315, 0.320)6032.04068.0
4(0.320, 0.325)3532.56567.5
5(0.325, 0.330)1533.08567.0

带 X 和 X*X 的型号

系数

系数系数标准误Z 值P 值方差膨胀因子
常量-2.1070.282-7.460.000 
X0.09040.01217.460.00011.97
X*X-0.0008890.000115-7.750.00011.97

拟合优度检验

检验自由度卡方P 值
偏差23.780.151
Pearson23.760.152
Hosmer-Lemeshow33.760.288

Hosmer-Lemeshow 检验的观测频率和预期频率



事件非事件
事件概率范围观测期望观测期望
1(0.000, 0.108)1010.89089.2
2(0.108, 0.124)1512.48587.6
3(0.124, 0.401)4040.16059.9
4(0.401, 0.419)3541.96558.1
5(0.419, 0.548)6054.84045.2