顺序 Logistic 回归示例

一家诊所的管理者想要了解影响患者满意度的因素。患者会被问及他们是不可能、有可能还是很可能会回诊所复诊。相关预测变量包括就业状况、年龄以及是否离诊所近。

管理者使用患者复诊的可能性作为响应变量。响应变量的类别按不可能到很可能的自然顺序排列，因此响应变量是按顺序排列的。响应变量是按顺序排列的，因此管理者使用顺序 Logistic 回归对预测变量和响应变量之间的关系建模。管理者使用显著性水平 0.05 来评估模型的统计显著性和模型的拟合优度。

打开样本数据患者满意度.MWX。
选择复诊列中的任意单元格。
右键单击工作表并选择列属性 > 值顺序。
选择用户指定的顺序并按此顺序排列这些值：
- 很可能
- 有可能
- 不可能
选择统计 > 回归 > 顺序 Logistic 回归。
在响应中，输入 '复诊'。
在模型中，输入距离距离*距离。
单击确定。

解释结果

所有斜率均为零的检验的 P 值小于 0.05。较小的 P 值表示响应变量和预测变量之间的关系在统计上显著。两种拟合优度检验的 P 值都大于 0.05。这些较大的 P 值无法提供模型不适用的证据。

在 Logistic 回归表中，“距离”和“距离*距离”的 P 值均小于显著性水平 0.05。“距离”的系数为负，表示一般情况下，患者住宅离诊所越远，复诊的可能性越小。“距离*距离”的系数为正，表示在特定的距离后，患者复诊的可能性会变大。根据这些结果，管理者认为，住宅离诊所近的患者安排复诊的可能性较大，因为前往诊所较为方便。第一次就愿意走较远的路赴约的患者复诊的可能性也较大。管理者打算添加新的调查问题来验证这些想法。管理者还打算研究模型的预测能力以确定患者复诊可能性会变大的距离。

顺序 Logistic 回归: 复诊与距离

链接函数:Logit

响应信息

变量	值	计数
复诊	很可能	19
	有可能	43
	不可能	11
	合计	73

Logistic 回归表

						95% 置信区间
自变量	系数	系数标准误	Z	P	优势比	下限	上限
常量(1)	6.38671	3.06110	2.09	0.037
常量(2)	9.31883	3.15929	2.95	0.003
距离	-1.25608	0.523879	-2.40	0.017	0.28	0.10	0.80
距离*距离	0.0495427	0.0214636	2.31	0.021	1.05	1.01	1.10

对数似然 = -66.118

所有斜率等于零的检验

自由度	G	P 值
2	6.066	0.048

拟合优度检验

方法	卡方	自由度	P
Pearson	114.903	100	0.146
偏差	94.779	100	0.629