在二元 Logistic 回归中,您可以输入两种不同的数据格式:二元响应/频率格式和事件/试验格式。有输出中某些统计量的可信度和解释取决于数据的格式。有关何时使用每种数据格式的更多信息,请转到何时使用二元 Logistic 回归中的每种数据格式

数据格式对偏差 R2 和调整后偏差 R2 的解释的影响

对于二元 Logistic 回归,数据的格式会影响对偏差 R2 值和调整后偏差 R2 值的解释。在事件/试验格式中,每个观测值代表该行数据的所有试验中出现事件的概率。通常,此概率针对许多试验,而且介于 0 和 1 之间。与之相反,二元响应/频率格式中的每个观测值通常仅表示 1 个试验。单个试验的观测值为 1 或 0。

通常,数据格式之间的差异会使得数据中的总偏差不同。对于事件/试验数据,偏差与预测概率和观测概率之间的差异相关。对于二元响应/频率格式,偏差与预测概率和每个试验的结果(0% 或 100%)相关。事件/试验格式的数据中的偏差 R2 和调整后偏差 R2 通常较高。

图示阐释了数据格式之间的差异。在这些图中,符号表示数据中的观测值,曲线表示模型中的预测值。对于事件/试验数据,符号接近直线。事件/试验数据的偏差 R2 值大约为 96%。模型能够很好地预测平均概率。

对于二元响应/频率数据,只有当直线接近 0% or 100% 时,观测值才接近预测直线。二元响应/频率数据的偏差 R2 值大约为 56%。预测概率和单个工况之间的关系不是那么强。

为什么二元响应/频率数据的偏差拟合优度检验可能会产生误解

对于二元 Logistic 回归,数据的格式会影响偏差拟合优度检验是否可靠。偏差拟合优度检验的 p 值通常会随着每行试验数的递减而递减。二元响应/频率格式的数据中每行的试验数通常会较少。因此,如果数据为二元响应/频率格式,则偏差拟合优度检验可能指示拟合较差,即使实际上拟合很好也是如此。当数据为事件/试验格式,但每行的试验数较少时,偏差拟合优度检验还可能会错误地指出拟合较差。

Hosmer-Lemeshow 检验不依赖数据的格式。当数据中每行的试验数很少时,Hosmer-Lemeshow 检验能够更可靠地指出模型对数据的拟合优度。

比较相同数据在采用不同格式时的两组结果。对于这些数据,模型的形式是正确的。Hosmer-Lemeshow 检验的响应信息、系数和结果相同。偏差拟合优度检验的结论取决于数据格式。

在这些结果中,数据采用没有频率列的二元响应/频率格式。分析使用 500 行数据。每行表示 1 个试验。在 0.05 显著性水平下,偏差拟合优度检验的 p 值指示模型的拟合较差。此 p 值会导致错误地断定模型格式不正确。如果您收集二元响应/频率格式的数据,则偏差拟合优度检验通常不可靠。

二值 Logistic 回归: Y 与 X

方法 链接函数 Logit 已使用的行数 500
响应信息 变量 值 计数 Y 事件 160 (事件) 非事件 340 合计 500
系数 方差膨 项 系数 系数标准误 胀因子 常量 -2.107 0.282 X 0.0904 0.0121 11.97 X*X -0.000889 0.000115 11.97
拟合优度检验 检验 自由度 卡方 P 值 偏差 497 552.03 0.044 Pearson 497 504.42 0.399 Hosmer-Lemeshow 3 3.76 0.288

在这些结果中,数据采用事件/试验格式。分析使用 5 行数据。每行数据表示 100 个试验。在 0.05 显著性水平下,偏差拟合优度检验的 p 值找不到差拟合模型的证据。如果您收集事件/试验格式的数据,偏差拟合优度检验通常比较可靠。

二值 Logistic 回归: 事件 与 X

方法 链接函数 Logit 已使用的行数 5
响应信息 变量 值 计数 事件名称 事件 事件 160 事件 非事件 340 试验 合计 500
系数 方差膨 项 系数 系数标准误 胀因子 常量 -2.107 0.282 X 0.0904 0.0121 11.97 X*X -0.000889 0.000115 11.97
拟合优度检验 检验 自由度 卡方 P 值 偏差 2 3.78 0.151 Pearson 2 3.76 0.152 Hosmer-Lemeshow 3 3.76 0.288

为什么二元响应/频率数据的 Pearson 拟合优度检验可能会产生误解

对于二元 Logistic 回归,数据的格式会影响 Pearson 拟合优度检验是否可靠。如果每行中的预计事件数量较小,则 Pearson 检验使用的卡方分布近似不准确。二元响应/频率格式的数据中每行的试验数通常会较少。因此,如果数据为二元响应/频率格式,则 Pearson 拟合优度检验可能不准确。

Hosmer-Lemeshow 检验不依赖数据的格式。当数据中每行的试验数很少时,Hosmer-Lemeshow 检验能够更可靠地指出模型对数据的拟合优度。

比较相同数据在采用不同格式时的两组结果。对于这些数据,模型的形式是正确的。实际模型包含 X1 和 X2 之间的交互作用。Hosmer-Lemeshow 检验的响应信息、系数和结果相同。Pearson 拟合优度检验的结论取决于数据格式。

在这些结果中,数据采用带有频率列的二元响应/频率格式。分析使用 18 行数据。每行表示 250 个 Bernoulli 试验。在 0.05 显著性水平下,Pearson 拟合优度检验的 p 值指示模型能够拟合数据。此 p 值会导致错误地断定模型足以拟合数据。如果您收集二元响应/频率格式的数据,则 Pearson 拟合优度检验不可靠。

二值 Logistic 回归: Y 与 X1, X2

方法 链接函数 Logit 频率 频率 已使用的行数 18
响应信息 变量 值 计数 Y 是 2645 (事件) 否 1855 合计 4500
系数 方差膨 项 系数 系数标准误 胀因子 常量 -0.612 0.110 X1 0.1585 0.0375 1.00 X2 0.3290 0.0377 1.00
拟合优度检验 检验 自由度 卡方 P 值 偏差 4497 6004.05 0.000 Pearson 4497 4504.84 0.464 Hosmer-Lemeshow 7 66.06 0.000

在这些结果中,数据采用事件/试验格式。分析使用 9 行数据。每行数据表示 500 个试验。在 0.05 显著性水平下,Pearson 拟合优度检验的 p 值的确指出模型无法拟合数据。如果您收集事件/试验格式的数据,Pearson 拟合优度检验通常比较可靠。

二值 Logistic 回归: Y 与 X1, X2

方法 链接函数 Logit 已使用的行数 9
响应信息 事件 变量 值 计数 名称 Y 事件 2645 是 非事件 1855 试验数 合计 4500
系数 方差膨 项 系数 系数标准误 胀因子 常量 -0.612 0.110 X1 0.1585 0.0375 1.00 X2 0.3290 0.0377 1.00
拟合优度检验 检验 自由度 卡方 P 值 偏差 6 67.48 0.000 Pearson 6 66.06 0.000 Hosmer-Lemeshow 7 66.06 0.000