解释二值拟合线图的主要结果

要解释二元拟合线图,请完成以下步骤。关键输出包括 p 值、拟合线图、R2 及残差图。

步骤 1:确定响应变量和预测变量之间的关联在统计上是否显著

要确定响应变量与预测变量之间的关联在统计意义上是否显著,请将该项的 p 值与显著性水平进行比较以评估原假设。原假设声明预测变量的系数等于零,这表明预测变量和响应变量之间没有关联。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在关联时得出存在关联的风险为 5%。
P 值 ≤ α:关联在统计意义上显著
如果 P 值小于或等于显著性水平,则可以得出响应变量与预测变量之间的关联在统计意义上显著的结论。
P 值 > α:关联在统计意义上不显著
如果 P 值大于显著性水平,则无法得出响应变量与预测变量之间的关联在统计意义上显著的结论。

方差分析

来源自由度调整后偏差调整后均值卡方P 值
回归122.705222.705222.710.000
  剂量(毫克)122.705222.705222.710.000
误差40.93730.2343   
合计523.6425     
主要结果:P 值

在这些结果中,剂量的 p 值为 0.000,该值小于显著性水平 0.05。这些结果表示剂量和治疗结束时是否存在细菌之间的关联在统计上显著。

步骤 2:了解预测变量的效应

使用优势比了解预测变量的效应。当模型使用 Logit 链接函数时,Minitab 会计算优势比。

优势比大于 1 表示在预测变量越大,事件发生的几率越大。优势比小于 1 表示预测变量越大,事件发生的几率越小。

连续预测变量的优势比

变更单位优势比95% 置信区间
剂量(毫克)0.56.1279(1.7218, 21.8087)
主要结果:优势比

在这些结果中,该模型使用药物的剂量水平来预测成人体内是否存在细菌。每颗药的剂量为 0.5 毫克,因此研究人员使用 0.5 毫克作为一个单位变化。优势比约为 6。成人每额外服用一颗药,患者不感染细菌的几率大约会增加 6 倍。

使用拟合线图可以检查响应变量与预测变量之间的关系。

主要结果:二元拟合线图

在这些结果中,将方程写入为成功概率。y 轴上的响应值 1 代表成功。该图显示成功概率随温度升高而递减。当数据中的温度接近 50 时,线斜率不是很大,这表明概率随温度升高而缓慢递减。如果温度数据中间部分的线倾斜度较大,则表明 1 度的温度变化会对此范围产生较大影响。当成功概率在高温范围接近于零时,则线会再次趋于平直。

步骤 3:确定模型对数据的拟合优度

要确定模型对数据的拟合优度,请检查模型汇总表格中的统计量。对于二元 Logistic 回归,数据格式会影响偏差 R2 统计量,而不影响 AIC。有关更多信息,请转到数据格式对二元 Logistic 回归中拟合优度的影响

偏差 R-Sq

偏差 R2 越高,模型拟合数据的优度越高。偏差 R2 始终在 0% 和 100%之间。

Deviance R2 always increases when you add additional predictors to a model. For example, the best 5-predictor model will always have an R2 that is at least as high as the best 4-predictor model. Therefore, deviance R2 is most useful when you compare models of the same size.

对于二元 Logistic 回归,数据格式会影响偏差 R2 值。偏差 R2 通常要高于事件/试验格式的数据。偏差 R2 值仅在使用相同数据格式的两个模型之间可比较。

偏差 R2 只是一个预测模型对数据拟合优度的度量标准。即便模型具有较高的 R2 值,您也应该检查残差图以评估模型对数据的拟合优度。

偏差 R-sq (adj)

使用调整的偏差 R2 来比较具有不同预测变量数量的模型。如果向模型添加预测变量,偏差 R2 也会始终增加。调整的偏差 R2 值在模型中包含了预测变量数,以帮助您选择正确的模型。

AIC、AICc 和 BIC
对于 二值拟合线图,可以使用信息标准来比较不同链接函数或不同预测变量的拟合优度。值越小越合意。但是,具有最小值的模型不一定很好地拟合数据。还需要使用检验和残差图来评估模型对数据的拟合优度。

模型汇总

偏差 R-Sq偏差 R-Sq (调整)AICAICcBICROC 曲线下面积
96.04%91.81%10.6314.6310.220.9398
主要结果:偏差 R-Sq、偏差 R-Sq (adj)、AIC

在这些结果中,模型可以解释响应变量中 96.04% 的偏差。对于这些数据,偏差 R2 值表示模型与数据充分拟合。如果其他模型与不同的预测变量拟合,请使用其他值比较模型拟合数据的优度。

步骤 4:确定模型是否符合分析的假设

使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。

有关如何处理残差图模式的更多信息,请转到二值拟合线图的图形,然后单击页面顶部列表中残差图的名称。

残差与拟合值图

使用残差与拟合值图可验证残差随机分布的假设。理想情况下,点应当在 0 的两端随机分布,点中无可辨识的模式。

残差与拟合值图仅在数据采用事件/试验格式时适用。

下表中的模式可能表示该模型不满足模型假设。
模式 模式的含义
残差相对拟合值呈扇形或不均匀分散 不合适的链接函数
曲线 缺少高阶项或不合适的链接函数
远离 0 的点 异常值
在 X 方向远离其他点的点 有影响的点
在这个残差与拟合值图中,数据似乎随机分布在零附近。没有证据表明残差值取决于拟合值。

残差与顺序图

使用残差与顺序图可验证残差独立于其他残差的假设。当以时序显示时,独立残差不显示趋势或模式。点中的模式可能表明,彼此相近的残差可能相关联,因此并不独立。理想情况下,图中的残差应围绕中心线随机分布:
如果查看模式,便可查出原因。下列类型的模式可能表明残差属于依赖项。
趋势
偏移
周期
在这个残差与顺序图中,残差似乎随机分布在中心线周围。没有证据表明残差是不独立的。