指定二值 Logistic 回归的编码方案 拟合二元 Logistic 模型

统计 > 回归 > 二元 Logistic 回归 > 拟合二元 Logistic 模型 > 编码

预测分析模块 > 二值 Logistic 回归 > 编码

优势比增量

对于使用 Logit 链接函数的模型,Minitab 会计算优势比。对于一些预测变量,当预测变量变化 1 个单位时,默认优势比不适用。例如,如果质量变化 1 克时的优势比过小,请输入 1,000 以查看质量变化 1 千克时的优势比。
连续预测变量
显示模型中连续预测变量的所有名称。此列不接受任何输入。
增量
输入 Minitab 用于计算优势比的连续预测变量的变化量。

类别变量的编码

类别预测变量编码
要执行分析,Minitab 需要使用两种方法中的一种来对类别预测变量重新编码。请根据是要将预测变量水平与基线还是参考水平进行比较来考虑改变方法。编码架构不会改变对预测变量总体效应的检验。有关更多信息,请转到类别预测变量的编码方案
  • (-1, 0, +1):选择该项可估计每个水平和基线之间的差异。
  • (1, 0):选择以估计每个水平均值和参考水平均值之间的差分。如果选择 (1, 0) 编码方案,参考水平表会在对话框中激活。
参考水平表格
类别预测变量
该表格中的这一列显示了模型中类别预测变量的所有名称。此列不接受任何输入。
参考水平

Minitab 会比较非参考水平与参考水平。更改参考水平不会影响整体显著性,但可能会让要解释的系数和优势比更有意义。

例如,有关客户是否有孩子的类别预测变量具有“是”和“否”两个水平。响应事件是客户在购物之旅是否购买麦片。

参考事件在优势比的分母中。当您更改参考水平时,优势比会倒置。当参考水平为“否”时,优势比遵循以下公式:
优势比为 5 表示当因子为“是”时客户购买麦片的几率是因子为“否”时的 5 倍。
当参考水平为“是”时,优势比遵循以下公式:
优势比为 0.2 表示当因子为“否”时客户购买麦片的几率是因子为“是”时的 0.2 倍。

当您更改参考水平时,系数的符号会发生改变。当参考水平为“是”时,系数为 -1.6。系数为负表示在因子的参考水平下客户购买麦片的几率大。当参考水平为“否”时,系数的符号变为 1.6。系数为正表示在因子的参考水平下客户购买麦片的几率小。

标准化连续预测变量

您可以选择标准化模型中的连续预测变量。标准化预测变量仅用于拟合模型,不会存储在工作表中。

标准化连续预测变量可以在特定条件下改善模型的解释。
  1. 通过减去平均值使连续预测变量处于中间位置:此方法有助于降低多重共线性,从而提高系数估计的精确度。当模型中包含高度相关的预测变量、高阶项和交互项时,此方法非常有用。每个系数表示在使用原始测量尺度的情况下,预测变量发生一个单位的变化时响应变量的预期变化。
  2. 通过除以标准差来标准化连续预测变量的尺度:此方法可使预测变量的范围更具同质性,以便比较系数的大小。当您需要了解哪些预测变量具有较大效应并控制尺度差异时,此方法非常有用。但是,每个系数表示预测变量中的一个标准差发生变化时响应变量的预期变化。
使用以下方法之一标准化连续预测变量:
  • 不标准化:对连续预测变量使用原始数据。
  • 将要编码的低水平和高水平指定为 -1 和 +1:用于使预测变量处于中间位置,然后将其置于可比较尺度上。Minitab 将此方法用于试验设计 (DOE)。转换介于您指定的低值和高值之间的所有数据值,使这些值的范围介于 −1 和 +1 之间。在该表格中,输入低值和高值或使用样本中默认的最小值和最大值。
    连续预测变量
    显示模型中所有连续预测变量的名称。此列不接受任何输入。
    输入值为 −1 的代码。默认值是样本中的最小值。
    输入值为 +1 的代码。默认值为样本中的最大值。
  • 减去均值,然后除以标准差:用于使预测变量处于中间位置,然后将其置于可比较尺度上。
  • 减去均值:用于使预测变量处于中间位置。
  • 除以标准差:对所有预测变量使用可比较尺度。
  • 减去指定值,然后除以另一个值:指定其他值,而不是使用样本中的平均值和标准差估计值。
    连续预测变量
    显示模型中所有连续预测变量的名称。此列不接受任何输入。
    输入每个连续预测变量要减去的值。
    除以
    输入 Minitab 用于除以相减结果的值。