稳定性研究的拟合和诊断

查找拟合和诊断的定义和解释指导。

拟合值

拟合值也称为拟合或。拟合值是对指定预测变量值的平均响应的点估计。预测变量值也称为 x 值。

解释

拟合值是通过将数据集内每个观测值的特定 x 值输入到模型方程中来计算的。

例如,如果方程为 y = 5 + 10x,则 x 值 2 的拟合值为 25 (25 = 5 + 10(2))。

其拟合值与观测值显著不同的观测值可能是异常值。具有异常预测变量值的观测值可能是有影响的观测值。如果 Minitab 确定数据包含异常值或有影响的值,则输出中会包含“异常观测值的拟合值与诊断”表,此表可确定这些观测值。Minitab 标记的异常观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大标准化残差的标准,因为具有较大的标准化残差,预计将标记约 5% 的观测值。有关异常值的更多信息,请转到异常观测值

拟合值 SE

拟合值标准误(拟合值 SE)用于估计指定变量设置的估计平均响应中的变异。将使用拟合值标准误来计算平均响应的置信区间。标准误始终为非负值。

解释

使用拟合值标准误可度量平均响应估计值的精确度。标准误越小,预测平均响应越精确。例如,一位分析人员设计了一个用于预测交货时间的模型。对于一组变量设置,该模型预测平均交货时间为 3.80 天。这些设置的拟合值标准误为 0.08 天。对于第二组变量设置,模型生成了相同的平均交货时间,但是拟合值标准误为 0.02 天。该分析人员可以确信:第二组变量设置的平均交货时间更接近 3.80 天。

您可以将拟合值标准误与拟合值结合使用,从而创建平均响应的置信区间。例如,根据自由度的数量,95% 置信区间将大约从预测均值上方和下方展开两个标准误。对于交货时间,当标准误为 0.08 时,预测均值 3.80 天的 95% 置信区间为 (3.64, 3.96) 天。总体均值在此范围内的置信度为 95%。当标准误为 0.02 时,95% 置信区间为 (3.76, 3.84) 天。第二组变量设置的置信区间更窄,因为其标准误较小。

拟合值的置信区间(95% 置信区间)

这些置信区间 (CI) 是可能包含总体的平均响应的值范围,该总体在模型中具有预测变量或因子的观测值。

由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。

置信区间由以下两部分组成:

解释

使用置信区间可以为变量的实测值评估拟合值的估计值。

例如,当置信水平为 95% 时,模型中包含预测变量或因子特定值的总体均值的置信区间的置信度为 95%。置信区间有助于评估结果的实际意义。利用您的专业知识可以确定置信区间是否包含对您的情形有实际意义的值。较宽的置信区间表明,有关未来值的均值的置信度可能较低。如果区间因为太宽而无效,请考虑增加样本数量。

残差

残差 (ei) 是观测值 (y) 与其相应的拟合值 () 之间的差值,此差值是由模型预测的值。

此散点图显示成年男性样本的体重和身高。拟合回归线表示身高和体重之间的关系。如果身高等于 6 英尺,体重的拟合值则为 190 磅。如果实际体重为 200 磅,则残差为 10。

解释

绘制残差图可确定模型是否适用且符合回归的假设。检查残差可以提供有关模型对数据的拟合优度的有用信息。通常,残差应当是随机分布的,而且没有明显的模式和异常值。如果 Minitab 确定数据包含异常观测值,则会在输出的“异常观测值的拟合与诊断”表中确定这些观测值。Minitab 标记的异常观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大残差的标准,因为具有较大的残差,预计将大致标记 5% 的观测值。有关异常值的更多信息,请转到异常观测值

标准化残差

标准化残差等于残差值 (ei) 除以其标准差的估计值。

解释

使用标准化残差可帮助您检测异常值。大于 2 和小于 −2 的标准化残差通常被视为较大值。“异常观测值的拟合与诊断”表使用“R”来标识这些观测值。Minitab 标记的观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大标准化残差的标准,因为具有较大的标准化残差,预计将大致标记 5% 的观测值。有关更多信息,请转到异常观测值

标准化残差非常有用,因为原始残差可能不是有效的异常值指示符。每个原始残差的方差可能会因与之相关的 x 值的不同而有所差异。这一变异不等情况会造成难以评估原始残差的量级。标准化残差则可以通过将不同方差转换为通用尺度来解决该问题。

删后残差

每个 t 化删后残差采用相当于从数据集中系统地删除每个观测值、估计回归方程,然后确定模型对已删除观测值的预测优度的公式来计算。每个 t 化删后残差还通过将观测值的删后残差除以其标准差的估计值来实现标准化。删除观测值是为了确定没有此观测值时模型的行为。如果观测值的 t 化删后残差较大(如果其绝对值大于 2),则它可能是数据中的异常值。

解释

使用 t 化删后残差可删除异常值。删除每个观测值是为了确定当模型拟合过程中不包含观测值时,模型预测响应的优度。大于 2 或小于 −2 的 t 化删后残差通常被视为较大值。Minitab 标记的观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大残差的标准,因为具有较大的残差,预计将大致标记 5% 的观测值。如果分析表明存在多个异常观测值,则模型可能无法充分说明预测变量与响应变量之间的关系。有关更多信息,请转到异常观测值

标准化残差和删后残差与原始残差相比,在确定异常值方面可能更为有用。它们会根据不同的预测变量值或因子,调整原始残差的方差中可能的差值。

Hi(杠杆率)

Hi 也称为杠杆率,用于度量某个观测值的 x 值与数据集中所有观测值的 x 值的平均值之间的距离。

解释

Hi 值介于 0 和 1 之间。Minitab 会在异常观测值表的拟合值与诊断中用 X 标识杠杆率值大于 3p/n 或 0.99(以较小者为准)的观测值。在 3p/n 中,p 是模型中的系数数目,n 是观测值个数。由 Minitab 标记为“X”的观测值可能是有影响的观测值。

有影响的观测值对模型具有不成比例的影响,会产生误导性结果。例如,包含或不包含有影响的点可能会改变系数是否统计意义显著。有影响的观测值可以是杠杆率点、异常值或这两者。

如果看到有影响的观测值,请确定该观测值是否存在数据输入或测量错误。如果该观测值既不存在数据输入错误又不存在测量错误,请确定它会造成何种影响。首先,拟合带该观测值的模型和不带该观测值的模型。然后,比较系数、p 值、R2 和其他模型信息。如果在排除有影响的观测值后模型有显著变化,请进一步检查模型,确定在模型中是否指定了错误内容。您可能需要收集更多数据以解决此问题。

Cook 距离 (D)

Cook 距离 (D) 度量观测值对于线性模型中系数集的效应。Cook 距离会同时考虑每个观测值的杠杆率值和标准化残差,以便确定观测值的效应。

解释

具有较大 D 值的观测值可能被视为有影响的观测值。较大 D 值的常用标准为,当 D 大于 F 分布的中位数 F(0.5, p, n-p) 时,其中 p 是模型项数(包括常量),n 是观测值数。另一种检验 D 值的方法是使用图形(如单值控制图)将 D 值与另一个值相比较。相对于其他观测值,具有较大 D 值的观测值可能是有影响的观测值。

有影响的观测值对模型具有不成比例的影响,会产生误导性结果。例如,包含或不包含有影响的点可能会改变系数是否统计意义显著。有影响的观测值可以是杠杆率点、异常值或这两者。

如果看到有影响的观测值,请确定该观测值是否存在数据输入或测量错误。如果该观测值既不存在数据输入错误又不存在测量错误,请确定它会造成何种影响。首先,拟合带该观测值的模型和不带该观测值的模型。然后,比较系数、p 值、R2 和其他模型信息。如果在排除有影响的观测值后模型有显著变化,请进一步检查模型,确定在模型中是否指定了错误内容。您可能需要收集更多数据以解决此问题。

DFITS

DFITS 度量每个观测值对于线性模型中拟合值的效应。DFITS 大致表示从数据集中删除每个观测值并重新拟合模型时,拟合值改变的标准差的数量。

解释

具有较大 DFITS 值的观测值可能是有影响的观测值。较大 DFITS 值的常用标准是 DFITS 是否大于以下值:
说明
p模型项的数量
n观测值个数

有影响的观测值对模型具有不成比例的影响,会产生误导性结果。例如,包含或不包含有影响的点可能会改变系数是否统计意义显著。有影响的观测值可以是杠杆率点、异常值或这两者。

如果看到有影响的观测值,请确定该观测值是否存在数据输入或测量错误。如果该观测值既不存在数据输入错误又不存在测量错误,请确定它会造成何种影响。首先,拟合带该观测值的模型和不带该观测值的模型。然后,比较系数、p 值、R2 和其他模型信息。如果在排除有影响的观测值后模型有显著变化,请进一步检查模型,确定在模型中是否指定了错误内容。您可能需要收集更多数据以解决此问题。

条件拟合值与残差

当批次是随机因子时,条件拟合值是特定批次的拟合值。观测值的条件残差等于响应的观测值减去响应的条件拟合值。

解释

当批次是随机因子时,可使用条件拟合值了解研究中特定批次之间的差异。

条件均值的自由度

自由度 (DF) 表示数据中的信息量,用来估计平均响应的置信区间。

解释

使用自由度可以比较有关不同条件均值的可用信息量。一般而言,自由度越大,均值的置信区间越窄;自由度越小,均值置信区间越宽。由于不同观测值的均值的标准误不同,因此具有较大自由度的均值的置信区间不一定比具有较小自由度的均值的置信区间窄。

边际拟合值与残差

当批次是随机因子时,边际拟合值是整个总体的拟合值。观测值的边际残差等于响应的观测值减去响应的边际拟合值。

解释

当批次是随机因子时,可使用边际拟合值来预测未来任何批次的响应值。

边际均值的自由度

自由度 (DF) 表示数据中的信息量,用来估计平均响应的置信区间。

解释

使用自由度可以比较有关不同边际均值的可用信息量。一般而言,自由度越大,均值的置信区间越窄;自由度越小,均值置信区间越宽。由于不同观测值的均值的标准误不同,因此具有较大自由度的均值的置信区间不一定比具有较小自由度的均值的置信区间窄。