解释一般多元方差分析的主要结果

请完成以下步骤来解释多元方差分析。主要输出包含 p 值、系数、R2 和残差图。

步骤 1:检验所有响应的等均值

要同时检验所有响应中的均值是否相等,请将每个项的多元方差分析检验表中的 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在关联时得出存在关联的风险为 5%。
P 值 ≤ α:均值之间的差值在统计意义上显著
如果 p 值小于或等于显著性水平,则可以得出均值的差值在统计意义上显著的结论。
P 值 > α:均值之间的差值在统计意义上不显著
如果 p 值大于显著性水平,则无法得出均值的差值在统计意义上显著的结论。您可能希望重新拟合没有该项的模型。
如果多个预测变量与响应在统计意义上没有显著的关联,则可以通过删除项(一次删除一个)来简化模型。有关从模型中删除项的更多信息,请转到模型简化
如果一个模型项在统计意义上显著,则解释取决于该项的类型。解释如下所示:
  • 如果一个主效应显著,则在模型的所有响应中,该因子的水平均值之间存在显著差异。
  • 如果交互作用项的效应显著,那么每个因子的效应在模型内所有响应中的其他因子的不同水平下有所不同。因此,没有必要分析显著高次交互作用中所包含项的单个效应。

方法 的多元方差分析检验




自由度
标准检验统计量F分子分母P
Wilks'0.6309916.0822550.000
Lawley-Hotelling0.5848216.0822550.000
Pillai's0.3690116.0822550.000
Roy's0.58482       
s = 1    m = 0    n = 26.5

工厂 的多元方差分析检验




自由度
标准检验统计量F分子分母P
Wilks'0.891781.62141100.174
Lawley-Hotelling0.119721.61641080.175
Pillai's0.109671.62541120.173
Roy's0.10400       
s = 2    m = -0.5    n = 26.5

方法*工厂 的多元方差分析检验




自由度
标准检验统计量F分子分母P
Wilks'0.858262.18441100.075
Lawley-Hotelling0.164392.21941080.072
Pillai's0.142392.14641120.080
Roy's0.15966       
s = 2    m = -0.5    n = 26.5
主要结果:P

当显著性水平为 0.10 时,生产方法的 p 值在统计意义上显著。对于任何检验来说,当显著性水平为 0.10 时,制造厂的 p 值并不显著。当显著性水平为 0.10 时,工厂和方法之间交互作用的 p 值在统计意义上显著。由于交互作用在统计意义上显著,因此该方法的效应取决于工厂。

步骤 2:确定每个因子的哪种响应均值具有最大差值

使用特征分析来评估响应均值在不同模型项水平之间如何不同。您应重点关注与高特征值相对应的特征向量。要显示特征分析,请转到统计 > 方差分析 > 一般多元方差分析 > 结果并选择特征分析下的结果显示

方法 的特征分析

特征值0.58480.00000
比率1.00000.00000
累积1.00001.00000
特征向量12
可用性评级0.144062-0.07870
质量评级-0.0039680.13976
主要结果:特征值,特征向量

在这些结果中,方法的第一个特征值 (0.5848) 大于第二个特征值 (0.00000)。因此,您应更重视第一个特征向量。方法的第一个特征值为 0.144062,-0.003968。此向量中的最高绝对值用于可用性评级。这表明,可用性均值具有方法因子水平之间的最大差值。此信息对于评估均值表十分有用。

步骤 3:评估组均值之间的差值

使用“均值”表可理解数据中因子水平之间的统计显著性差异。每组的均值都提供了每个总体均值的估计值。请查找统计意义显著的项组均值之间的差异。

对于主效应,该表显示每个因子内的组及其均值。对于交互作用项效应,该表显示组的所有可能的组合。如果交互作用项在统计意义上显著,则在不考虑交互作用效应的情况下,不解释主效应。

要显示均值,请转到统计 > 方差分析 > 一般多元方差分析 > 结果,选择单变量方差分析,并在显示与项对应的最小二乘均值中输入项。

响应的最小二乘均值


可用性评级质量评级

均值均值标准误均值均值标准误
方法       
  方法 14.8190.1655.2420.193
  方法 26.2120.1796.0260.211
工厂       
  工厂 A5.7080.1925.8330.226
  工厂 B5.4930.2325.9140.273
  工厂 C5.3450.2065.1550.242
方法*工厂       
  方法 1 工厂 A4.6670.2725.4170.319
  方法 1 工厂 B4.7000.2985.4000.350
  方法 1 工厂 C5.0910.2844.9090.334
  方法 2 工厂 A6.7500.2726.2500.319
  方法 2 工厂 B6.2860.3566.4290.418
  方法 2 工厂 C5.6000.2985.4000.350
主要结果:均值

在这些结果中,均值表显示均值可用性和质量评分如何根据方法、设备以及方法*设备交互作用项而变化。方法和交互作用项在 0.10 水平时统计意义显著。该表显示方法 1 和方法 2 分别与均值可用性评分 4.819 和 6.212 相关。这些均值之间的差值大于质量评分的相应均值之间的差值。这确认了特征值分析的解释。

但是,因为方法*设备交互作用项的统计意义也显著,所以不考虑交互作用效应就无法解释主效应。例如,交互作用项表显示,使用方法 1,设备 C 与最高可用性评分和最低质量评分相关。但是,使用方法 2,设备 A 与最高可用性评分和约等于最高质量评分的质量评分相关。

步骤 4:评估单变量结果以检查单个响应值

执行一般多元方差分析时,您可以选择计算单变量统计量来检查单个响应。单变量结果有利于更直观地理解数据关系。但是,单变量结果可能不同于多变量结果。

要显示单变量结果,请转到统计 > 方差分析 > 一般多元方差分析 > 结果并在结果显示下选择单变量方差分析

要确定响应与模型中每个项之间的关联在统计意义上是否显著,请将该项的 P 值与显著性水平进行比较以评估原假设。原假设声明该项与响应之间没有关联。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在关联时得出存在关联的风险为 5%。
P 值 ≤ α:关联在统计意义上显著
如果 P 值小于或等于显著性水平,则可以得出响应变量与项之间的关联在统计意义上显著的结论。
P 值 > α:关联在统计意义上不显著
如果 p 值大于显著性水平,则无法得出响应变量与该项之间的关联在统计意义上显著的结论。您可能希望重新拟合没有该项的模型。
如果多个预测变量与响应在统计意义上没有显著的关联,则可以通过删除项(一次删除一个)来简化模型。有关从模型中删除项的更多信息,请转到模型简化
如果一个模型项在统计意义上显著,则解释取决于该项的类型。解释如下所示:
  • 如果一个类别因子显著,则可以得出并非所有水平均值都相等的结论。
  • 如果一个交互作用项显著,则因子与响应之间的关系取决于该项中的其他因子。在这种情况下,不应在不考虑交互作用效应时解释主效应。
  • 如果一个协变量在统计意义上显著,则可以得出结论:该协变量的值的变化与平均响应值的变化相关联。
  • 如果一个多项式项显著,则可以得出数据包含弯曲的结论。

可用性评级 的方差分析,在检验中使用调整的 SS

来源自由度Seq SSAdj SSAdj MSFP
  方法131.26429.07429.073832.720.000
  工厂21.3661.4990.74950.840.436
  方法*工厂27.0997.0993.54943.990.024
误差5649.75449.7540.8885   
合计6189.484       

质量评级 的方差分析,在检验中使用调整的 SS

来源自由度Seq SSAdj SSAdj MSFP
  方法18.85879.21969.21967.530.008
  工厂26.76327.05723.52862.880.064
  方法*工厂20.70740.70740.35370.290.750
误差5668.590068.59001.2248   
合计6184.9194       
主要结果:P

在这些结果中,在用于对可用性评级的模型中,方法主效应和方法*设备交互作用项效应的 p 值在水平为 0.10 时统计意义上显著。在用于对质量进行评级的模型中,方法和设备的主效应在统计意义上均显著。您可推断出这些变量的变化是与响应变量的变化相关的。

步骤 5:确定模型是否符合分析的假设条件

使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。

执行一般多元方差分析时,Minitab 会显示模型中的所有响应变量残差图。您必须确定所有响应变量的残差图是否表示模型符合假设。

有关如何处理残差图模式的更多信息,请转到一般多元方差分析的残差图,然后单击页面顶部列表中残差图的名称。

残差与拟合值图

使用残差与拟合值图可验证残差随机分布和具有常量方差的假设。理想情况下,点应当在 0 的两端随机分布,点中无可辨识的模式。

下表中的模式可能表示该模型不满足模型假设。
模式 模式的含义
残差相对拟合值呈扇形或不均匀分散 异方差
曲线 缺少高阶项
远离 0 的点 异常值
在 X 方向远离其他点的点 有影响的点
在这个残差与拟合值图中,数据似乎随机分布在零附近。没有证据表明残差值取决于拟合值。

残差与顺序图

使用残差与顺序图可验证残差独立于其他残差的假设。当以时序显示时,独立残差不显示趋势或模式。点中的模式可能表明,彼此相近的残差可能相关联,因此并不独立。理想情况下,图中的残差应围绕中心线随机分布:
如果查看模式,便可查出原因。下列类型的模式可能表明残差属于依赖项。
趋势
偏移
周期
在此残差图和顺序图中,残差似乎会围绕中心线随机衰减。没有证据表明残差为非独立的。

残差的正态概率图

使用残差正态概率图可验证残差呈正态分布的假设。残差的正态概率图应该大致为一条直线。

下表中的模式可能表示该模型不满足模型假设。
模式 模式的含义
非直线 非正态性
远离直线的点 异常值
斜率不断变化 未确定的变量
在此正态概率图中,点通常为一条直线。没有证据表明存在非正态性、异常值或未确定的变量。