解释顺序 Logistic 回归的主要结果

要解释顺序 Logistic 回归,请完成以下步骤。主要输出包括 P 值、系数、对数似然和相关性度量。

步骤 1:确定响应变量和项之间的关联在统计上是否显著

要确定响应与模型中每个项之间的关联在统计意义上是否显著,请将该项的 P 值与显著性水平进行比较以评估原假设。原假设声明该项与响应之间没有关联。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在关联时得出存在关联的风险为 5%。
P 值 ≤ α:关联在统计意义上显著
如果 P 值小于或等于显著性水平,则可以得出响应变量与项之间的关联在统计意义上显著的结论。
P 值 > α:关联在统计意义上不显著
如果 p 值大于显著性水平,则无法得出响应变量与该项之间的关联在统计意义上显著的结论。您可能希望重新拟合没有该项的模型。
如果多个预测变量与响应在统计意义上没有显著的关联,则可以通过删除项(一次删除一个)来简化模型。有关从模型中删除项的更多信息,请转到模型简化

对于具有超过 2 个水平的类别因子,系数的假设与因子的水平是否不同于因子的参考水平有关。要评估因子的统计显著性,请将该检验用于具有超过 1 个自由度的项。有关如何显示该检验的更多信息,请转到为顺序 Logistic 回归选择要显示的结果

响应信息 变量 值 计数 复诊 很可能 19 有可能 43 不可能 11 合计 73
Logistic 回归表 95% 置信区 间 自变量 系数 系数标准误 Z P 优势比 下限 上限 常量(1) -0.505898 0.938791 -0.54 0.590 常量(2) 2.27788 0.985924 2.31 0.021 距离 -0.0470551 0.0797374 -0.59 0.555 0.95 0.82 1.12
主要结果:P 值、系数

患者满意度调查分析可以检查患者距离诊所远近和患者复诊可能性之间的关系。在这些结果中,距离在显著性水平为 0.05 时具有统计显著性。您可以断定距离的变化与不同的事件发生的概率的变化相关。

评估系数以确定预测变量的变化能否让任何事件发生的可能性变大或变小。系数和概率之间的关系取决于分析的多个方面,包括链接函数。当预测变量增大时,正系数会使第一个事件和距离该事件较近的事件发生的可能性变大。当预测变量增大时,负系数会使最后一个事件和距离该事件较近的事件发生的可能性变大。有关更多信息,请转到系数

“距离”的系数约为 −0.05,这表示距离越大,响应变量“不可能”的概率越大,响应变量“很可能”的概率越小。

步骤 2:确定模型对数据的拟合优度

要确定模型对数据的拟合优度,请检查对数似然和相关性度量。对数似然值越大,数据拟合得越好。由于对数似然值为负,因此越接近于 0,值越大。对数似然取决于样本数据,因此您无法使用对数似然比较不同数据集的模型。

当您向模型中添加项时,对数似然无法减小。例如,5 项模型的对数似然大于使用相同项构建的任何 4 项模型的对数似然。因此,对数似然最适用于比较具有相同样本数量的模型。要对单独项做出决策,通常您可以查看项在不同 Logit 中的 P 值。

Somers' D、Goodman-Kruskal Gamma 和 Kendall's tau-a 的值越大,表明模型的预测能力越强。Somers' D 和 Goodman-Kruskal Gamma 可以介于 -1 和 1 之间。Kendall's tau-a 可以介于 -2/3 和 2/3 之间。值接近于 0,表明模型无法预测响应变量。负值实际很少见,因为该情况下的预测能力比模型和响应变量不相关时的预测能力差。

顺序 Logistic 回归: 复诊 与 距离

链接函数:Logit

响应信息 变量 值 计数 复诊 很可能 19 有可能 43 不可能 11 合计 73
Logistic 回归表 95% 置信区 间 自变量 系数 系数标准误 Z P 优势比 下限 上限 常量(1) -0.505898 0.938791 -0.54 0.590 常量(2) 2.27788 0.985924 2.31 0.021 距离 -0.0470551 0.0797374 -0.59 0.555 0.95 0.82 1.12

对数似然 = -68.987

所有斜率等于零的检验 自由度 G P 值 1 0.328 0.567
拟合优度检验 方法 卡方 自由度 P Pearson 97.419 101 0.582 偏差 100.516 101 0.495
相关性度量: (响应变量与预测概率之间) 配对 数量 百分比 度量结果综述 一致 832 55.5 Somer 的 D 0.13 不一致 637 42.5 Goodman-Kruskal Gamma 0.13 结 30 2.0 Kendall 的 Tau-a 0.07 合计 1499 100.0
主要结果:对数似然、Somer 的 D、Goodman-Kruskal Gamma、Kendall 的 Tau-a

例如,一家诊所的管理者研究了影响患者满意度的因素。在第一组结果中,患者去医生门诊的距离可以预测患者复诊的可能性。对数似然为 −68.987。Somers' D 和 Goodman-Kruskal gamma 为 0.13。Kendall's tau-a 为 0.07。这些值如果接近于 0,则表明距离和响应变量之间的关系较弱。所有斜率均为零的检验的 P 值大于 0.05,因此这位管理者尝试了另一个模型。

在第二组结果中,距离和距离的平方都是预测变量。您无法使用对数似然比较这些模型,因为这些模型包含的项数不同。第二个模型的相关性度量较高,这表示第二个模型的执行能力比第一个模型的好。

顺序 Logistic 回归: 复诊 与 距离

* 警告 * 20 次迭代后,算法未收敛。 * 警告 * 对于对数似然标准或参数估计标准,都未达到收敛。 * 警告 * 结果可能不可靠。 * 警告 * 尝试增加最大迭代次数。

链接函数:Logit

响应信息 变量 值 计数 复诊 不可能 2 很可能 3 有可能 4 合计 9
Logistic 回归表 95% 置信区间 自变量 系数 系数标准误 Z P 优势比 下限 上限 常量(1) -8.37842 44.7209 -0.19 0.851 常量(2) -6.68100 44.7154 -0.15 0.881 距离 3.06326 13.2432 0.23 0.817 21.40 0.00 4.00884E+12 距离*距离 -0.285089 0.962191 -0.30 0.767 0.75 0.11 4.96

对数似然 = -292.087

所有斜率等于零的检验 自由度 G P 值 2 0.000 1.000
拟合优度检验 方法 卡方 自由度 P Pearson 79.970 100 0.930 偏差 541.172 100 0.000
相关性度量: (响应变量与预测概率之间) 配对 数量 百分比 度量结果综述 一致 274 79.2 Somer 的 D 0.77 不一致 6 1.7 Goodman-Kruskal Gamma 0.96 结 66 19.1 Kendall 的 Tau-a 0.10 合计 346 100.0
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策