要确定模型对数据的拟合优度,请检查对数似然和相关性度量。对数似然值越大,数据拟合得越好。由于对数似然值为负,因此越接近于 0,值越大。对数似然取决于样本数据,因此您无法使用对数似然比较不同数据集的模型。
当您向模型中添加项时,对数似然无法减小。例如,5 项模型的对数似然大于使用相同项构建的任何 4 项模型的对数似然。因此,对数似然最适用于比较具有相同样本数量的模型。要对单独项做出决策,通常您可以查看项在不同 Logit 中的 P 值。
Somers' D、Goodman-Kruskal Gamma 和 Kendall's tau-a 的值越大,表明模型的预测能力越强。Somers' D 和 Goodman-Kruskal Gamma 可以介于 -1 和 1 之间。Kendall's tau-a 可以介于 -2/3 和 2/3 之间。值接近于 0,表明模型无法预测响应变量。负值实际很少见,因为该情况下的预测能力比模型和响应变量不相关时的预测能力差。
Logistic 回归表
|
|
|
|
| 95% 置信区间 |
---|
常量(1) | -0.505898 | 0.938791 | -0.54 | 0.590 | | | |
---|
常量(2) | 2.27788 | 0.985924 | 2.31 | 0.021 | | | |
---|
距离 | -0.0470551 | 0.0797374 | -0.59 | 0.555 | 0.95 | 0.82 | 1.12 |
---|
拟合优度检验
Pearson | 97.419 | 101 | 0.582 |
---|
偏差 | 100.516 | 101 | 0.495 |
---|
相关性度量:
(响应变量与预测概率之间)
一致 | 832 | 55.5 | Somer 的 D | 0.13 |
---|
不一致 | 637 | 42.5 | Goodman-Kruskal Gamma | 0.13 |
---|
结 | 30 | 2.0 | Kendall 的 Tau-a | 0.07 |
---|
合计 | 1499 | 100.0 | | |
---|
主要结果:对数似然、Somer 的 D、Goodman-Kruskal Gamma、Kendall 的 Tau-a
例如,一家诊所的管理者研究了影响患者满意度的因素。在第一组结果中,患者去医生门诊的距离可以预测患者复诊的可能性。对数似然为 −68.987。Somers' D 和 Goodman-Kruskal gamma 为 0.13。Kendall's tau-a 为 0.07。这些值如果接近于 0,则表明距离和响应变量之间的关系较弱。所有斜率均为零的检验的 P 值大于 0.05,因此这位管理者尝试了另一个模型。
在第二组结果中,距离和距离的平方都是预测变量。您无法使用对数似然比较这些模型,因为这些模型包含的项数不同。第二个模型的相关性度量较高,这表示第二个模型的执行能力比第一个模型的好。
顺序 Logistic 回归: 复诊 与 距离
Logistic 回归表
|
|
|
|
| 95% 置信区间 |
---|
常量(1) | 6.38671 | 3.06110 | 2.09 | 0.037 | | | |
---|
常量(2) | 9.31883 | 3.15929 | 2.95 | 0.003 | | | |
---|
距离 | -1.25608 | 0.523879 | -2.40 | 0.017 | 0.28 | 0.10 | 0.80 |
---|
距离*距离 | 0.0495427 | 0.0214636 | 2.31 | 0.021 | 1.05 | 1.01 | 1.10 |
---|
拟合优度检验
Pearson | 114.903 | 100 | 0.146 |
---|
偏差 | 94.779 | 100 | 0.629 |
---|
相关性度量:
(响应变量与预测概率之间)
一致 | 938 | 62.6 | Somer 的 D | 0.29 |
---|
不一致 | 505 | 33.7 | Goodman-Kruskal Gamma | 0.30 |
---|
结 | 56 | 3.7 | Kendall 的 Tau-a | 0.16 |
---|
合计 | 1499 | 100.0 | | |
---|