和二值 Logistic 回归的方法表拟合二元 Logistic 模型

查找方法表的定义和解释指导。

关于本主题

类别预测变量编码
连续预测变量标准化
链接函数
响应信息
验证

类别预测变量编码

Minitab 可以使用 (0, 1) 或 (−1, 0, +1) 编码方案以在模型中包含类别变量。(0, 1) 方案是回归分析的默认方案，而 (−1, 0, +1) 方案是方差分析和 DOE 的默认方案。在这两种方案之间的选择不会改变类别变量的统计显著性。但是，编码方案的确会改变系数和解释系数的方式。

解释

验证显示的编码方案，以确保执行预期分析。解释类别变量的系数，如下所示：

对于 (0, 1) 编码架构，每个系数表示每个水平和参考水平之间的差异。参考水平的系数为 0。
对于 (−1, 0, +1) 编码架构，每个系数表示水平平均值和基线之间的差异。

连续预测变量标准化

如果您选择对模型中的连续预测变量进行标准化，Minitab 将提供有关连续预测变量标准化表中的方法的详细信息。

通常，使用标准化来使变量处于中间位置或/和使变量尺度化。使变量处于中间位置时，可以减少多项式项和交互作用项引起的多重共线性，从而提高系数估计值的精度。大多数情况下，使变量尺度化时，Minitab 会将变量的不同尺度转换为公共尺度，从而可以比较系数的大小。

解释

使用标准化方法表可验证是否按预期执行了分析。根据您选择的方法，您可能必须更改系数解释，如下所示：

将要编码的低水平和高水平指定为 -1 和 +1: 此方法可以使变量处于中间位置并使变量尺度化。每个系数都表示预测变量在编码尺度上每变化 1 个单位时变换的响应变量的均值的预期变化。例如，该系数表示预测变量从 0 变为 +1 时变换的响应变量的均值的变化。
减去均值，然后除以标准差: 此方法可以使变量处于中间位置并使变量尺度化。每个系数都表示预测变量每变化 1 个单位的标准差时变换的响应变量的均值的预期变化。
减去均值: 此方法可以使变量处于中间位置。每个系数都表示预测变量每变化 1 个单位时变换的响应变量的均值的预期变化。
除以标准差: 此方法可以使变量尺度化。每个系数都表示预测变量每变化 1 个单位的标准差时变换的响应变量的均值的预期变化。
减去指定值，然后除以另一个值: 此方法是否可以使变量处于中间位置或使变量尺度化取决于您指定的值。每个系数都表示预测变量除以一个数后变换的响应变量的均值的预期变化。例如，如果您除以 4，则该系数表示原始测量尺度增加 4。

系数的确切解释还取决于分析的其他方面（如链接函数）。

链接函数

链接函数将区间 (0, 1) 映射到整条实线上。这样可以保证使用模型预测的事件概率会产生一个介于 0 和 1 之间的数字。Minitab 提供三种链接函数：

Logit
Normit (probit)
Gompit (互补对数 - 对数)

解释

使用链接函数查找以最佳方式与数据拟合的模型。使用拟合优度统计量和不同的链接函数比较各种拟合。使用某些链接函数可能是出于历史原因或因为其在规律方面有特殊意义。

Logit 链接函数的一个优势就是它可以提供模型中的每个预测变量的优势比的估计值。

响应信息

Minitab 显示了响应的以下信息：

变量: 响应变量的名称。
值: 响应变量的水平
计数: 每个响应变量水平上的观测值数
合计: 非缺失观测值数

输出还可以确定哪个响应水平是参考事件。

解释

使用响应信息检查分析中的数据量。通常情况下，每个水平出现多次的随机样本越大，提供的有关总体的推断越精确。

还可以使用响应信息确定哪个事件是参考事件。系数和优势比等统计量的解释取决于哪个事件是参考事件。

验证

使用检验数据集时，该表将显示检验数据集内数据的百分比。使用交叉验证时，该表将显示折叠数。当您指定的列用于指定检验数据集内具有哪些观测值或者每个折叠中具有哪些观测值时，该表将显示该列的标题。

解释

验证结果中的验证方法，以确保执行了预期分析。

和 二值 Logistic 回归的方法表 拟合二元 Logistic 模型