解释二元 Logistic 回归的估计系数

估计系数的解释取决于:链接函数、参考事件和参考因子水平。与预测变量(因子或协变量)关联的估计系数表示当所有其他预测变量保持恒定时,预测变量发生一个单位的变化时链接函数的变化。因子的单位变化是指某水平与参考水平的比较。有关更改类别预测变量的参考水平的更多信息,请转到为拟合二元 Logistic 模型指定编码架构。有关更改响应变量的参考事件的更多信息,请转到为拟合二元 Logistic 模型输入数据

Logit 链接为估计系数提供了最自然的解释,因此它是 Minitab 中的默认链接。解释会利用参考事件几率为 P(事件)/P(非事件) 并假设其他预测变量保持恒定的情况。对于 Logit 链接函数,几率的自然对数是估计系数的函数。

ln [P(事件)/P(非事件)] = β0 + β1x1 + β2x2 + ... + βnxn

其中:
  • ln = 自然对数函数
  • P = 概率
  • β0 = 截距
  • βi = xi 的系数
  • xi = 预测变量
对数几率越大,参考事件发生的可能性越大。因此,正系数表示事件发生的可能性变大,负系数表示事件发生的可能性变小。不同类型的预测变量的解释汇总都遵循此标准。
连续预测变量

连续预测变量的系数是预测变量发生一个单位的变化时,参考事件的几率的自然对数的估计变化。例如,如果以秒为单位的时间的系数为 1.4,则时间每增加一秒,几率的自然对数就增加 1.4。

估计系数也可以用于计算优势比,即两个优势之间的比率。对预测变量的系数取指数。结果是预测变量为 x+1 时(相较于预测变量为 x 时)的优势比。例如,如果以千克为单位的质量的优势比为 0.95,则质量每增加一千克时,事件的概率会降低约 5%。

对于连续预测变量,几率的解释可能比优势比的解释更有意义。

使用 1、0 编码的类别预测变量

从参考水平变为系数的水平时,系数就是几率的自然对数中的估计变化。例如,一个类别变量的水平为“快”和“慢”,参考水平为“慢”。如果“快”的系数为 1.3,则当变量从“慢”变为“快”时,事件的几率的自然对数会增加 1.3。

估计系数也可以用于计算优势比,即两个优势之间的比率。对水平的系数取指数。结果是相较于参考水平的水平的优势比。例如,一个类别变量的水平为“硬”和“软”,“软”为参考水平。如果“硬”的优势比为 0.5,则当水平从“软”变为“硬”时,事件的几率会降低 50%。

使用 1、0、-1 编码的类别预测变量

从几率的自然对数的均值变为系数的水平时,系数就是几率的自然对数中的估计变化。例如,一个类别变量的水平为“变化前”和“变化后”。如果“变化后”的系数为 −2.1,则当变量等于“变化后”时,事件的几率的自然对数会降低 2.1。

估计系数也可以用于计算优势比。为了找到要取指数的值,请减去要比较的系数。例如,一个类别变量的水平为“红色”、“黄色”和“绿色”。要计算“红色”和“黄色”的优势比,请从“黄色”的系数中减去“红色”的系数。对结果取指数。如果优势比为 1.02,则水平从“红色”变为“黄色”时,事件的几率会增加 2%。