稳定性研究的系数表格

请查找定义和解释指导,了解系数表格中的每个统计量。

系数

回归系数描述了预测变量和响应变量之间关系的大小和方向。系数是回归方程中要与项值相乘的数值。

解释

每个系数的解释取决于它是时间的连续系数还是批次的类别系数。
时间
时间变量的系数表示时间每变化一个单位时均值响应发生的变化。如果系数为负,响应的均值会随时间减小。如果系数为正,响应的均值会随时间增大。
批次
将为批次因子的除一个水平之外的每个水平列出一个系数。缺失的水平就是批次因子的参考水平。每个系数表示该水平均值和参考水平均值之间的均值差异。

在现有的交互作用中,系数的解释很复杂。在这些结果中,质量工程师想要估计一种新药物的保质期。批次 1 的系数为负,表示批次 1 的药物效能低于批次 6 的参考水平的药物效能。但是,批次 1 的“月份*批次”交互作用项的系数为正。时间的效应取决于批次,因此批次 1 和批次 6 之间的差异会随时间变化。

系数

系数系数标准误T 值P 值方差膨胀因子
常量100.0850.143701.820.000 
月数-0.136330.00769-17.740.0001.07
批次         
  1-0.2320.292-0.800.4323.85
  20.0680.2920.230.8183.85
  30.3940.2751.430.1623.41
  4-0.3170.292-1.080.2873.85
  50.0880.2750.320.752*
月数*批次         
  10.04540.01642.760.0104.52
  2-0.02410.0164-1.470.1524.52
  3-0.02670.0136-1.960.0603.65
  40.00140.01640.080.9354.52
  50.00400.01360.300.769*

通常,系数的大小是评估项对于响应变量是否具有实际显著效应的好方式。但是,系数的大小不代表一个项是否在统计意义上显著,因为显著性的计算还要考虑响应数据中的变异。要确定统计显著性,请检查该项的 p 值。

系数标准误

系数的标准误可以通过估计样本数据的系数来估计不确定性。

解释

使用系数的标准误来度量系数估计值的精确度。标准误越小,估计值越精确。将系数除以其标准误计算 t 值。如果与此 t 统计量关联的 P 值小于显著性水平(用 alpha 或 α 表示),则可以断定系数在统计上显著。

T 值

T 值用来度量系数与其标准误之间的比值。

解释

Minitab 使用 t 值计算 p 值,该 p 值可用于检验系数是否与 0 显著不同。

您可以使用 t 值来确定是否要否定原假设。但是,通常会使用 p 值,因为无论自由度是多少,否定原假设的阈值都相同。有关使用 t 值的更多信息,请转到使用 t 值来确定是否要否定原假设

P 值 – 系数

P 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。

解释

对于稳定性研究,系数表只包含 P 值小于分析显著性水平的项。原假设为项的系数等于零。默认的显著性水平为 0.25。显著性水平 0.25 指示在实际上不存在关联时得出存在关联的风险为 25%。

如果一个模型项在统计上显著,则解释取决于该项的类型:
  • 如果时间显著,则响应会随时间变化。
  • 如果批次显著,则不同批次的均值响应不同。
  • 如果“时间*批次”交互作用项显著,则批次随时间变化的速度取决于批次。

系数的置信区间(95% 置信区间)

这些置信区间 (CI) 是可能包含模型中每个项的实际系数值的值范围。

由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果随机取样多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。

置信区间由以下两部分组成:
点估计
此单个值通过使用样本数据来估计总体参数。置信区间集中在此点估计值附近。
边际误差
边际误差定义了置信区间的宽度并由样本、样本数量和置信水平中的观测变异性确定。要计算置信区间的上限,需要将边际误差与点估计值相加。要计算置信区间的下限,需要从点估计值减去边际误差。

解释

使用置信区间可以评估模型中每个项的总体系数估计值。

例如,当置信水平为 95% 时,包含总体系数值的置信区间的置信度为 95%。置信区间有助于评估结果的实际意义。利用您的专业知识可以确定置信区间是否包含对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。

方差膨胀因子

方差膨胀因子 (VIF) 表示,根据模型中预测变量之间的关联,系数方差膨胀的程度。

解释

使用 VIF 来描述回归分析中存在的多重共线性的程度(与预测变量之间相关联)。多重共线性存在问题,因为它可能会增大回归系数的方差,从而难以评估每个相关预测变量对于响应值的单独影响。

使用以下准则解释 VIF:
VIF 预测变量状态
VIF = 1 不相关
1 < VIF < 5 中等相关
VIF > 5 高度相关
VIF 值大于 5 表明,由于严重的多重共线性,回归系数估计不足。

有关多重共线性以及如何减轻多重共线性的影响的更多信息,请查看回归中的多重共线性