回归系数描述了预测变量和响应变量之间关系的大小和方向。系数是回归方程中要与项值相乘的数值。
在现有的交互作用中,系数的解释很复杂。在这些结果中,质量工程师想要估计一种新药物的保质期。批次 1 的系数为负,表示批次 1 的药物效能低于批次 6 的参考水平的药物效能。但是,批次 1 的“月份*批次”交互作用项的系数为正。时间的效应取决于批次,因此批次 1 和批次 6 之间的差异会随时间变化。
项 | 系数 | 系数标准误 | T 值 | P 值 | 方差膨胀因子 |
---|---|---|---|---|---|
常量 | 100.085 | 0.143 | 701.82 | 0.000 | |
月数 | -0.13633 | 0.00769 | -17.74 | 0.000 | 1.07 |
批次 | |||||
1 | -0.232 | 0.292 | -0.80 | 0.432 | 3.85 |
2 | 0.068 | 0.292 | 0.23 | 0.818 | 3.85 |
3 | 0.394 | 0.275 | 1.43 | 0.162 | 3.41 |
4 | -0.317 | 0.292 | -1.08 | 0.287 | 3.85 |
5 | 0.088 | 0.275 | 0.32 | 0.752 | * |
月数*批次 | |||||
1 | 0.0454 | 0.0164 | 2.76 | 0.010 | 4.52 |
2 | -0.0241 | 0.0164 | -1.47 | 0.152 | 4.52 |
3 | -0.0267 | 0.0136 | -1.96 | 0.060 | 3.65 |
4 | 0.0014 | 0.0164 | 0.08 | 0.935 | 4.52 |
5 | 0.0040 | 0.0136 | 0.30 | 0.769 | * |
通常,系数的大小是评估项对于响应变量是否具有实际显著效应的好方式。但是,系数的大小不代表一个项是否在统计意义上显著,因为显著性的计算还要考虑响应数据中的变异。要确定统计显著性,请检查该项的 p 值。
系数的标准误可以通过估计样本数据的系数来估计不确定性。
使用系数的标准误来度量系数估计值的精确度。标准误越小,估计值越精确。将系数除以其标准误计算 t 值。如果与此 t 统计量关联的 P 值小于显著性水平(用 alpha 或 α 表示),则可以断定系数在统计上显著。
T 值用来度量系数与其标准误之间的比值。
Minitab 使用 t 值计算 p 值,该 p 值可用于检验系数是否与 0 显著不同。
您可以使用 t 值来确定是否要否定原假设。但是,通常会使用 p 值,因为无论自由度是多少,否定原假设的阈值都相同。有关使用 t 值的更多信息,请转到使用 t 值来确定是否要否定原假设。
P 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。
对于稳定性研究,系数表只包含 P 值小于分析显著性水平的项。原假设为项的系数等于零。默认的显著性水平为 0.25。显著性水平 0.25 指示在实际上不存在关联时得出存在关联的风险为 25%。
这些置信区间 (CI) 是可能包含模型中每个项的实际系数值的值范围。
由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果随机取样多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。
使用置信区间可以评估模型中每个项的总体系数估计值。
例如,当置信水平为 95% 时,包含总体系数值的置信区间的置信度为 95%。置信区间有助于评估结果的实际意义。利用您的专业知识可以确定置信区间是否包含对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。
方差膨胀因子 (VIF) 表示,根据模型中预测变量之间的关联,系数方差膨胀的程度。
使用 VIF 来描述回归分析中存在的多重共线性的程度(与预测变量之间相关联)。多重共线性存在问题,因为它可能会增大回归系数的方差,从而难以评估每个相关预测变量对于响应值的单独影响。
VIF | 预测变量状态 |
---|---|
VIF = 1 | 不相关 |
1 < VIF < 5 | 中等相关 |
VIF > 5 | 高度相关 |
有关多重共线性以及如何减轻多重共线性的影响的更多信息,请查看回归中的多重共线性。