顺序 Logistic 回归示例

一家诊所的管理者想要了解影响患者满意度的因素。患者会被问及他们是不可能、有可能还是很可能会回诊所复诊。相关预测变量包括就业状况、年龄以及是否离诊所近。

管理者使用患者复诊的可能性作为响应变量。响应变量的类别按不可能到很可能的自然顺序排列,因此响应变量是按顺序排列的。响应变量是按顺序排列的,因此管理者使用顺序 Logistic 回归对预测变量和响应变量之间的关系建模。管理者使用显著性水平 0.05 来评估模型的统计显著性和模型的拟合优度。

  1. 打开样本数据患者满意度.MTW
  2. 选择复诊列中的任意单元格。
  3. 右键单击工作表并选择列属性 > 值顺序
  4. 选择用户指定的顺序并按此顺序排列这些值:
    • 很可能
    • 有可能
    • 不可能
  5. 选择统计 > 回归 > 顺序 Logistic 回归
  6. 响应中,输入 '复诊'
  7. 模型中,输入距离 距离*距离
  8. 单击确定

解释结果

所有斜率均为零的检验的 P 值小于 0.05。较小的 P 值表示响应变量和预测变量之间的关系在统计上显著。两种拟合优度检验的 P 值都大于 0.05。这些较大的 P 值无法提供模型不适用的证据。

在 Logistic 回归表中,“距离”和“距离*距离”的 P 值均小于显著性水平 0.05。“距离”的系数为负,表示一般情况下,患者住宅离诊所越远,复诊的可能性越小。“距离*距离”的系数为正,表示在特定的距离后,患者复诊的可能性会变大。根据这些结果,管理者认为,住宅离诊所近的患者安排复诊的可能性较大,因为前往诊所较为方便。第一次就愿意走较远的路赴约的患者复诊的可能性也较大。管理者打算添加新的调查问题来验证这些想法。管理者还打算研究模型的预测能力以确定患者复诊可能性会变大的距离。

顺序 Logistic 回归: 复诊 与 距离

* 警告 * 20 次迭代后,算法未收敛。 * 警告 * 对于对数似然标准或参数估计标准,都未达到收敛。 * 警告 * 结果可能不可靠。 * 警告 * 尝试增加最大迭代次数。

链接函数:Logit

响应信息 变量 值 计数 复诊 不可能 2 很可能 3 有可能 4 合计 9
Logistic 回归表 95% 置信区间 自变量 系数 系数标准误 Z P 优势比 下限 上限 常量(1) -8.37842 44.7209 -0.19 0.851 常量(2) -6.68100 44.7154 -0.15 0.881 距离 3.06326 13.2432 0.23 0.817 21.40 0.00 4.00884E+12 距离*距离 -0.285089 0.962191 -0.30 0.767 0.75 0.11 4.96

对数似然 = -292.087

所有斜率等于零的检验 自由度 G P 值 2 0.000 1.000
拟合优度检验 方法 卡方 自由度 P Pearson 79.970 100 0.930 偏差 541.172 100 0.000
相关性度量: (响应变量与预测概率之间) 配对 数量 百分比 度量结果综述 一致 274 79.2 Somer 的 D 0.77 不一致 6 1.7 Goodman-Kruskal Gamma 0.96 结 66 19.1 Kendall 的 Tau-a 0.10 合计 346 100.0
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策