分析因子设计的拟合与诊断表

请在拟合值与诊断表中查找每个统计量的定义和解释指导。

拟合值

拟合值又称拟合或 。拟合值是对于给定预测变量值的均值响应的点估计值。预测变量的值也称为 x 值。

解释

拟合值是通过将数据集内每个观测值的特定 x 值输入到模型方程中来计算的。

例如,如果方程为 y = 5 + 10x,则 x 值 2 的拟合值为 25 (25 = 5 + 10(2))。

其拟合值与观测值显著不同的观测值可能是异常值。具有异常预测变量值的观测值可能是有影响的观测值。如果 Minitab 确定数据包含异常值或有影响的值,则输出中会包含“异常观测值的拟合与诊断”表,此表可确定这些观测值。Minitab 标记的异常观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大标准化残差的标准,因为具有较大的标准化残差,预计将大致标记 5% 的观测值。有关异常值的更多信息,请转到异常观测值

拟合值 SE

拟合值标准误(拟合值 SE)用于估计指定变量设置的估计平均响应中的变异。将使用拟合值标准误来计算平均响应的置信区间。标准误始终为非负值。

解释

使用拟合值标准误可度量平均响应估计值的精确度。标准误越小,预测平均响应越精确。例如,一位分析人员设计了一个用于预测交货时间的模型。对于一组变量设置,该模型预测平均交货时间为 3.80 天。这些设置的拟合值标准误为 0.08 天。对于第二组变量设置,模型生成了相同的平均交货时间,但是拟合值标准误为 0.02 天。该分析人员可以确信:第二组变量设置的平均交货时间更接近 3.80 天。

您可以将拟合值标准误与拟合值结合使用,从而创建平均响应的置信区间。例如,根据自由度的数量,95% 置信区间将大约从预测均值上方和下方展开两个标准误。对于交货时间,当标准误为 0.08 时,预测均值 3.80 天的 95% 置信区间为 (3.64, 3.96) 天。总体均值在此范围内的置信度为 95%。当标准误为 0.02 时,95% 置信区间为 (3.76, 3.84) 天。第二组变量设置的置信区间更窄,因为其标准误较小。

拟合值的置信区间(95% 置信区间)

这些置信区间 (CI) 是可能包含总体的平均响应的值范围,该总体在模型中具有预测变量或因子的观测值。

由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。

置信区间由以下两部分组成:
点估计值
点估计是从样本数据计算得到的参数的估计值。置信区间集中在此值附近。
边际误差
边际误差定义了置信区间的宽度并由样本、样本数量和置信水平中的观测变异性确定。要计算置信区间的上限,需要将边际误差与点估计相加。要计算置信区间的下限,需要从点估计减去边际误差。

解释

使用置信区间可以为变量的实测值评估拟合值的估计值。

例如,当置信水平为 95% 时,模型中包含预测变量或因子特定值的总体均值的置信区间的置信度为 95%。置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。较宽的置信区间表明,有关未来值的均值的置信度可能较低。如果区间因太宽而毫无用处,请考虑增加样本数量。

残差

残差 (ei) 是观测值 (y) 与其相应的拟合值 () 之间的差值,此差值是由模型预测的值。

此散点图显示成年男性样本的体重和身高。拟合回归线表示身高和体重之间的关系。如果身高等于 6 英尺,体重的拟合值则为 190 磅。如果实际体重为 200 磅,则残差为 10。

解释

绘制残差图可确定模型是否适用且符合回归的假设。检查残差可以提供有关模型对数据的拟合优度的有用信息。通常,残差应当是随机分布的,而且没有明显的模式和异常值。如果 Minitab 确定数据包含异常观测值,则会在输出的“异常观测值的拟合与诊断”表中确定这些观测值。Minitab 标记的异常观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大残差的标准,因为具有较大的残差,预计将大致标记 5% 的观测值。有关异常值的更多信息,请转到异常观测值

标准化残差

标准化残差等于残差值 (ei) 除以其标准差的估计值。

解释

使用标准化残差可帮助您检测异常值。大于 2 和小于 −2 的标准化残差通常被视为较大值。“异常观测值的拟合与诊断”表使用“R”来标识这些观测值。Minitab 标记的观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大标准化残差的标准,因为具有较大的标准化残差,预计将大致标记 5% 的观测值。有关更多信息,请转到异常观测值

标准化残差非常有用,因为原始残差可能不是有效的异常值指示符。每个原始残差的方差可能会因与之相关的 x 值的不同而有所差异。这一变异不等情况会造成难以评估原始残差的量级。标准化残差则可以通过将不同方差转换为通用尺度来解决该问题。

删后残差

每个 t 化删后残差采用相当于从数据集中系统地删除每个观测值、估计回归方程,然后确定模型对已删除观测值的预测优度的公式来计算。每个 t 化删后残差还通过将观测值的删后残差除以其标准差的估计值来实现标准化。删除观测值是为了确定没有此观测值时模型的行为。如果观测值的 t 化删后残差较大(如果其绝对值大于 2),则它可能是数据中的异常值。

解释

使用 t 化删后残差可删除异常值。删除每个观测值是为了确定当模型拟合过程中不包含观测值时,模型预测响应的优度。大于 2 或小于 −2 的 t 化删后残差通常被视为较大值。Minitab 标记的观测值未能很好地遵循建议的回归方程。但是,预计您将得到一些异常观测值。例如,基于较大残差的标准,因为具有较大的残差,预计将大致标记 5% 的观测值。如果分析表明存在多个异常观测值,则模型可能无法充分说明预测变量与响应变量之间的关系。有关更多信息,请转到异常观测值

标准化残差和删后残差与原始残差相比,在确定异常值方面可能更为有用。它们会根据不同的预测变量值或因子,调整原始残差的方差中可能的差值。

Hi(杠杆率)

Hi 也称为杠杆率,用于度量某个观测值的 x 值与数据集中所有观测值的 x 值的平均值之间的距离。

解释

Hi 值介于 0 和 1 之间。Minitab 会在异常观测值表的拟合值与诊断中用 X 标识杠杆率值大于 3p/n 或 0.99(以较小者为准)的观测值。在 3p/n 中,p 是模型中的系数个数,n 是观测值个数。Minitab 使用“X”标记的观测值可能是有影响的观测值。

有影响的观测值对模型具有不成比例的影响,会产生误导性结果。例如,包含或不包含有影响的点可能会改变系数是否统计意义显著。有影响的观测值可以是杠杆率点、异常值或这两者。

如果看到有影响的观测值,请首先确定该观测值是否是数据输入或测量错误。如果观测值既不是数据输入错误又不是测量错误,请确定观测值所造成的影响。首先,拟合带观测值和不带观测值的模型。然后,比较系数、p 值、R2 和其他模型信息。如果在排除有影响的观测值后模型有显著变化,请进一步检查模型,确定在模型中是否指定了错误内容。您可能需要收集更多数据以解决此问题。

Cook 距离 (D)

Cook 距离 (D) 度量观测值对于线性模型中系数集的效应。Cook 距离会同时考虑每个观测值的杠杆率值和标准化残差,以便确定观测值的效应。

解释

具有较大 D 值的观测值可能被视为有影响的观测值。较大 D 值的常用标准为 D 大于 F 分布的中位数:F(0.5, p, n-p),其中 p 是模型项数(包括常量),n 是观测值个数。另一种检验 D 值的方法是使用图形(如单值图)将它们与另一个值相比较。相对于其他观测值,具有较大 D 值的观测值可能是有影响的观测值。

有影响的观测值对模型具有不成比例的影响,会产生误导性结果。例如,包含或不包含有影响的点可能会改变系数是否在统计意义上显著。有影响的观测值可以是杠杆率点、异常值或这两者。

如果看到有影响的观测值,请确定该观测值是否存在数据输入或测量错误。如果该观测值既不存在数据输入错误又不存在测量错误,请确定它会造成何种影响。首先,拟合带该观测值的模型和不带该观测值的模型。然后,比较系数、p 值、R2 和其他模型信息。如果在排除有影响的观测值后模型有显著变化,请进一步检查模型,确定在模型中是否指定了错误内容。您可能需要收集更多数据以解决此问题。

DFITS

DFITS 测量每个观测值对于线性模型中拟合值的效应。DFITS 大致表示从数据集中删除每个观测值并重新拟合模型时,拟合值改变的标准差的数量。

解释

具有较大 DFITS 值的观测值可能是有影响的观测值。较大 DFITS 值的常用标准是 DFITS 是否大于以下值:
说明
p模型项的数量
n观测值个数

如果看到有影响的观测值,请确定该观测值是否存在数据输入或测量错误。如果该观测值既不存在数据输入错误又不存在测量错误,请确定它会造成何种影响。首先,拟合带该观测值的模型和不带该观测值的模型。然后,比较系数、p 值、R2 和其他模型信息。如果在排除有影响的观测值后模型有显著变化,请进一步检查模型,确定在模型中是否指定了错误内容。您可能需要收集更多数据以解决此问题。