解释顺序 Logistic 回归的主要结果

要解释顺序 Logistic 回归,请完成以下步骤。主要输出包括 P 值、系数、对数似然和相关性度量。

步骤 1:确定响应变量和项之间的关联在统计上是否显著

要确定响应与模型中每个项之间的关联在统计意义上是否显著,请将该项的 P 值与显著性水平进行比较以评估原假设。原假设声明该项与响应之间没有关联。通常,显著性水平(用 α 或 alpha 表示)为 .05 即可。显著性水平 .05 指示在实际上不存在关联时得出存在关联的风险为 5%。
P 值 ≤ α:关联在统计意义上显著
如果 P 值小于或等于显著性水平,则可以得出响应变量与项之间的关联在统计意义上显著的结论。
P 值 > α:关联在统计意义上不显著
如果 p 值大于显著性水平,则无法得出响应变量与该项之间的关联在统计意义上显著的结论。您可能希望重新拟合没有该项的模型。
如果多个预测变量与响应在统计意义上没有显著的关联,则可以通过删除项(一次删除一个)来简化模型。有关从模型中删除项的更多信息,请转到模型简化

对于具有超过 2 个水平的类别因子,系数的假设关于因子的水平是否不同于因子的参考水平。要评估因子的统计显著性,请将该检验用于具有超过 1 个自由度的项。有关如何显示该检验的更多信息,请转到选择要针对顺序 Logistic 回归显示的结果

响应信息

变量计数
复诊很可能19
  有可能43
  不可能11
  合计73

Logistic 回归表







95% 置信区间
自变量系数系数标准误ZP优势比下限上限
常量(1)-0.5058980.938791-0.540.590     
常量(2)2.277880.9859242.310.021     
距离-0.04705510.0797374-0.590.5550.950.821.12
主要结果:P 值、系数

患者满意度调查分析可以检查患者距离诊所远近和患者复诊可能性之间的关系。在这些结果中,距离在显著性水平为 .05 时没有统计显著性。不能断定距离的变化与发生不同事件的概率的变化有关。

评估系数以确定预测变量的变化能否让任何事件发生的可能性变大或变小。系数和概率之间的关系取决于分析的多个方面,包括链接函数。当预测变量增大时,正系数会使第一个事件和距离该事件较近的事件发生的可能性变大。当预测变量增大时,负系数会使最后一个事件和距离该事件较近的事件发生的可能性变大。有关更多信息,请转到系数

“距离”的系数约为 −..05,这表示距离越大,响应变量“不可能”的概率越大,响应变量“很可能”的概率越小。

步骤 2:确定模型对数据的拟合优度

要确定模型对数据的拟合优度,请检查对数似然和相关性度量。对数似然值越大,数据拟合得越好。由于对数似然值为负,因此越接近于 0,值越大。对数似然取决于样本数据,因此您无法使用对数似然比较不同数据集的模型。

当您向模型中添加项时,对数似然无法减小。例如,5 项模型的对数似然大于使用相同项构建的任何 4 项模型的对数似然。因此,对数似然最适用于比较具有相同样本数量的模型。要对单独项做出决策,通常您可以查看项在不同 Logit 中的 P 值。

Somers' D、Goodman-Kruskal Gamma 和 Kendall's tau-a 的值越大,表明模型的预测能力越强。Somers' D 和 Goodman-Kruskal Gamma 可以介于 -1 和 1 之间。Kendall's tau-a 可以介于 -2/3 和 2/3 之间。值接近于 0,表明模型无法预测响应变量。负值实际很少见,因为该情况下的预测能力比模型和响应变量不相关时的预测能力差。

链接函数:Logit

响应信息

变量计数
复诊很可能19
  有可能43
  不可能11
  合计73

Logistic 回归表







95% 置信区间
自变量系数系数标准误ZP优势比下限上限
常量(1)-0.5058980.938791-0.540.590     
常量(2)2.277880.9859242.310.021     
距离-0.04705510.0797374-0.590.5550.950.821.12
对数似然 = -68.987

所有斜率等于零的检验

自由度GP 值
10.3280.567

拟合优度检验

方法卡方自由度P
Pearson97.4191010.582
偏差100.5161010.495

相关性度量:

(响应变量与预测概率之间)
配对数量百分比度量结果综述
一致83255.5Somer 的 D0.13
不一致63742.5Goodman-Kruskal Gamma0.13
302.0Kendall 的 Tau-a0.07
合计1499100.0   
主要结果:对数似然、Somer 的 D、Goodman-Kruskal Gamma、Kendall 的 Tau-a

例如,一家诊所的管理者研究了影响患者满意度的因素。在第一组结果中,患者去医生门诊的距离可以预测患者复诊的可能性。对数似然为 −68.987。Somers' D 和 Goodman-Kruskal gamma 为 0.13。Kendall's tau-a 为 0.07。这些值如果接近于 0,则表明距离和响应变量之间的关系较弱。所有斜率均为零的检验的 P 值大于 0.05,因此这位管理者尝试了另一个模型。

在第二组结果中,距离和距离的平方都是预测变量。您无法使用对数似然比较这些模型,因为这些模型包含的项数不同。第二个模型的相关性度量较高,这表示第二个模型的执行能力比第一个模型的好。

顺序 Logistic 回归: 复诊 与 距离
链接函数:Logit

响应信息

变量计数
复诊很可能19
  有可能43
  不可能11
  合计73

Logistic 回归表







95% 置信区间
自变量系数系数标准误ZP优势比下限上限
常量(1)6.386713.061102.090.037     
常量(2)9.318833.159292.950.003     
距离-1.256080.523879-2.400.0170.280.100.80
距离*距离0.04954270.02146362.310.0211.051.011.10
对数似然 = -66.118

所有斜率等于零的检验

自由度GP 值
26.0660.048

拟合优度检验

方法卡方自由度P
Pearson114.9031000.146
偏差94.7791000.629

相关性度量:

(响应变量与预测概率之间)
配对数量百分比度量结果综述
一致93862.6Somer 的 D0.29
不一致50533.7Goodman-Kruskal Gamma0.30
563.7Kendall 的 Tau-a0.16
合计1499100.0