二值拟合线图的系数

在系数表格中查找每个统计量的定义和解释指导。

系数

回归系数描述了预测变量和响应变量之间关系的大小和方向。系数是回归方程中要与项值相乘的数值。

解释

使用系数可以确定预测变量的变化会让事件发生的可能性变大还是变小。预测变量的估计系数表示当模型中的其他预测变量保持恒定时,预测变量发生一个单位的变化时链接函数的变化。系数和概率之间的关系取决于分析的多个方面,包括链接函数、响应变量的参考事件和模型中类别预测变量的参考水平。一般而言,正系数会使事件发生的可能性变大,负系数会使事件发生的可能性变小。估计系数接近 0 表示预测变量的效应较小。

Logit 链接函数的解释

Logit 链接为估计系数提供了最自然的解释,因此它是 Minitab 中的默认链接。解释会利用参考事件几率为 P(事件)/P(非事件) 并假设其他预测变量保持恒定的情况。对数几率越大,参考事件发生的可能性越大。因此,正系数表示事件发生的可能性变大,负系数表示事件发生的可能性变小。不同类型的预测变量的解释汇总都遵循此标准。

连续预测变量的系数是预测变量发生一个单位的变化时,参考事件的几率的自然对数的估计变化。例如,如果以秒为单位的时间的系数为 1.4,则时间每增加一秒,几率的自然对数就增加 1.4。

估计系数也可以用于计算优势比,即两个优势之间的比率。要计算优势比,请对预测变量的系数取指数。结果是预测变量为 x+1 时(相较于预测变量为 x 时)的优势比。例如,如果以千克为单位的质量的优势比为 0.95,则质量每增加一千克时,事件的概率会降低约 5%。

系数标准误

如果反复从同一总体中取样,系数的标准误会估计您将获取的系数估计值之间的变异性。计算假定要估计的样本数量和系数在反复取样的情况下是否保持一致。

解释

使用系数的标准误来度量系数估计值的精确度。标准误越小,估计值越精确。

方差膨胀因子

方差膨胀因子 (VIF) 表示系数的方差会因多重共线性而变多大。

解释

使用 VIF 描述回归分析中存在的多重共线性有多大。多重共线性会产生问题,因为它会增大回归系数的方差,从而使得难以评估每个预测变量对响应变量的单独影响。

使用以下准则解释 VIF:
VIF 多重共线性
VIF = 1
1 < VIF < 5 中等
VIF > 5
VIF 值大于 5 表示因严重的多重共线性而使回归系数的估计不准确。

有关多重共线性和如何缓解多重共线性效应的更多信息,请参见回归多重共线性

回归方程

对于二元 Logistic 回归,Minitab 会显示两种类型的回归方程。第一种方程会将事件概率与变换的响应变量相关。第一种方程的形式取决于链接函数。第二种方程会将预测变量与变换的响应变量相关。

解释

使用这些方程研究响应变量和预测变量之间的关系。

例如,模型使用药物剂量预测患者体内不存在某种细菌的事件。第一种方程会因为 Logit 链接函数而显示概率和变换的响应变量之间的关系。第二种方程会显示剂量与变换后响应变量的相关方式。由于剂量的系数为正,因此当剂量较大时,存在细菌的可能性较小。

回归方程

P(无细菌)=exp(Y')/(1 + exp(Y'))
Y'=-5.25 + 3.63 剂量(毫克)

连续预测变量的优势比

优势比95% 置信区间
剂量(毫克)37.5511(2.9647, 475.6190)

优势比

优势比可比较两个事件的几率。事件的几率是事件发生的概率除以事件不发生的概率。当模型使用 Logit 链接函数时,Minitab 会计算优势比。

解释

使用优势比了解预测变量的效应。优势比大于 1,表示当预测变量增大时,事件发生的可能性较大。优势比小于 1,表示当预测变量增大时,事件发生的可能性较小。

在这些结果中,该模型使用药物的剂量水平来预测成人体内是否存在细菌。每颗药的剂量为 0.5 毫克,因此研究人员使用 0.5 毫克作为一个单位变化。优势比约为 6。成人每额外服用一颗药,患者不感染细菌的几率大约会增加 6 倍。

连续预测变量的优势比

变更单位优势比95% 置信区间
剂量(毫克)0.56.1279(1.7218, 21.8087)