Wald 检验 | |||
---|---|---|---|
来源 | 自由度 | 卡方 | P 值 |
回归 | 1 | 7.83 | 0.005 |
剂量(毫克) | 1 | 7.83 | 0.005 |
项 | 系数 | 系数标准误 | Z 值 | P 值 | 方差膨胀因子 |
---|---|---|---|---|---|
常量 | -5.25 | 1.99 | -2.64 | 0.008 | |
剂量(毫克) | 3.63 | 1.30 | 2.80 | 0.005 | 1.00 |
在这些结果中,剂量在显著性水平为 0.05 时具有统计显著性。您可推断出剂量的变化是与事件发生概率的变化相关的。
评估系数以确定预测变量的变化会让事件发生的可能性变大还是变小。系数和概率之间的关系取决于分析的多个方面,包括链接函数。通常,正系数表示,当预测变量增加时,事件发生的几率越大。负系数表示,当预测变量增加时,事件发生的几率越小。有关更多信息,请转到和 的 二值 Logistic 回归 拟合二元 Logistic 模型系数和回归方程。
剂量的系数为 3.63,这表示剂量越高,事件发生的概率越高。
如果一个交互作用项具有统计显著性,则预测变量与响应变量之间的关系将因其他预测变量的水平而异。在这种情况下,不应在不考虑交互作用效应时解释主效应。要更好地了解模型中的主效应、交互作用效应和弯曲,请转到因子图和响应优化器。
优势比大于 1 表示在预测变量越大,事件发生的几率越大。优势比小于 1 表示预测变量越大,事件发生的几率越小。
变更单位 | 优势比 | 95% 置信区间 | |
---|---|---|---|
剂量(毫克) | 0.5 | 6.1279 | (1.7218, 21.8087) |
在这些结果中,该模型使用药物的剂量水平来预测成人体内是否存在细菌。在此示例中,不存在细菌为“事件”。每颗药的剂量为 0.5 毫克,因此研究人员使用 0.5 毫克作为一个单位变化。优势比约为 6。成人每额外服用一颗药,患者不感染细菌的几率大约会增加 6 倍。
对于类别预测变量,优势比可以比较事件在两个不同的预测变量水平下发生的几率。Minitab 通过在水平 A 和水平 B 这两列中列出水平来设置比较。水平 B 是因子的参考水平。优势比大于 1 表示事件在水平 A 下发生的几率更大。优势比小于 1 表示事件在水平 A 下发生的几率更小。有关对类别预测变量编码的信息,请转到类别预测变量的编码方案。
水平 A | 水平 B | 优势比 | 95% 置信区间 |
---|---|---|---|
月份 | |||
2 | 1 | 1.1250 | (0.0600, 21.0834) |
3 | 1 | 3.3750 | (0.2897, 39.3165) |
4 | 1 | 7.7143 | (0.7461, 79.7592) |
5 | 1 | 2.2500 | (0.1107, 45.7172) |
6 | 1 | 6.0000 | (0.5322, 67.6397) |
3 | 2 | 3.0000 | (0.2547, 35.3325) |
4 | 2 | 6.8571 | (0.6556, 71.7169) |
5 | 2 | 2.0000 | (0.0976, 41.0019) |
6 | 2 | 5.3333 | (0.4679, 60.7946) |
4 | 3 | 2.2857 | (0.4103, 12.7323) |
5 | 3 | 0.6667 | (0.0514, 8.6389) |
6 | 3 | 1.7778 | (0.2842, 11.1200) |
5 | 4 | 0.2917 | (0.0252, 3.3719) |
6 | 4 | 0.7778 | (0.1464, 4.1326) |
6 | 5 | 2.6667 | (0.2124, 33.4861) |
在这些结果中,类别预测变量是距离酒店旺季开始时间的月份。响应是客户是否取消预定房间。在此示例中,取消预定房间为“事件”。当水平 A 为第 4 个月,水平 B 为第 1 个月时,最大的优势比大约为 7.71。这表示客户在第 4 个月取消预定房间的几率约为客户在第 1 个月取消预定房间的几率的 8 倍。
有关更多信息,请转到和 二值 Logistic 回归的比值比 拟合二元 Logistic 模型。
要确定模型对数据的拟合优度,请检查模型汇总表格中的统计量。
数据在工作表中的排列方式以及每行是存在一个还是多个试验会影响很多模型汇总和拟合优度统计量。Hosmer-Lemeshow 检验不会受数据格式影响,因此格式之间可比较。有关详细信息,请转到数据格式对二元 Logistic 回归中拟合优度的影响。
偏差 R2 越高,模型拟合数据的优度越高。偏差 R2 始终在 0% 和 100% 之间。
如果向模型添加其他预测变量,则偏差 R2 会始终增加。例如,最佳的 5 预测变量模型的 R2 始终比最佳的 4 预测变量模型的高(至少一样高)。因此,比较相同大小的模型时,偏差 R2 最有用。
对于二元 Logistic 回归,数据格式会影响偏差 R2 值。事件/试验格式的数据的偏差 R2 通常较高。仅在使用相同数据格式的模型之间可以比较偏差 R2 值。
拟合优度统计量只是模型拟合数据优度的一种度量。即使模型具有合意的值,您也应当检查残差图和拟合优度检验,以评估模型拟合数据的优度。
使用调整的偏差 R2 来比较具有不同预测变量数的模型。如果向模型添加预测变量,偏差 R2 也会始终增加。调整的偏差 R2 值在模型中包含了预测变量数,以帮助您选择正确的模型。
使用 AIC、AICc 和 BIC 比较不同的模型。对于每个统计量,较小的值比较合意。但是,对于预测变量集具有最小值的模型,不一定需要很准确地拟合数据。而且,还可使用拟合优度检验和残差图评估模型与数据的拟合优度。
ROC 曲线下面积的值范围是 0.5 到 1。当二元模型可以完美地分隔类时,曲线下面积为 1。当二元模型不能比随机分配更好地分隔类时,曲线下面积为 0.5。
偏差 R-Sq | 偏差 R-Sq (调整) | AIC | AICc | BIC | ROC 曲线下面积 |
---|---|---|---|---|---|
96.04% | 91.81% | 10.63 | 14.63 | 10.22 | 0.9398 |
在这些结果中,模型可以解释响应变量中 96.04% 的偏差。对于这些数据,偏差 R2 值表示模型与数据充分拟合。ROC 曲线下面积为 0.9398。此值指示模型对大部分数据进行正确分类。如果要拟合具有不同预测变量的其他模型,请使用调整的偏差 R2 值、AIC 值、AICc 值、BIC 值和 ROC 曲线下面积比较模型与数据的拟合优度。
如果偏离在统计上显著,则您可以尝试另一种链接函数或更改模型中的项。
对于二元 Logistic 回归,数据格式会影响 p 值,因为它会改变每行的试验数。
变量 | 值 | 计数 | 事件名称 |
---|---|---|---|
事件 | 事件 | 160 | 事件 |
非事件 | 340 | ||
试验 | 合计 | 500 |
检验 | 自由度 | 卡方 | P 值 |
---|---|---|---|
偏差 | 2 | 3.78 | 0.151 |
Pearson | 2 | 3.76 | 0.152 |
Hosmer-Lemeshow | 3 | 3.76 | 0.288 |
在这些结果中,响应信息表的变量列显示事件和试验。这些标签表示数据采用事件/试验格式。所有拟合优度检验的 P 值都大于常见显著水平 0.05。这些检验无法提供预测概率以二项分布无法预测的方式偏离观测概率的证据。
变量 | 值 | 计数 | |
---|---|---|---|
Y | 事件 | 160 | (事件) |
非事件 | 340 | ||
合计 | 500 |
检验 | 自由度 | 卡方 | P 值 |
---|---|---|---|
偏差 | 497 | 552.03 | 0.044 |
Pearson | 497 | 504.42 | 0.399 |
Hosmer-Lemeshow | 3 | 3.76 | 0.288 |
在使用相同数据的这些结果中,响应信息表的变量列显示 Y。此标签表示这些数据采用二元响应/频率格式。偏差检验的 P 值小于常见显著性水平 0.05,但 Hosmer-Lemeshow 检验是最可靠的检验。Hosmer-Lemeshow 检验无法提供预测概率以二项分布无法预测的方式偏离观测概率的证据。