数据均值与拟合均值的比较

数据均值是每个因子水平组合的原始响应变量均值,而拟合均值使用最小二乘来预测平衡设计的平均响应值。因此,这两种类型的均值对于平衡设计是相同的,但对于不平衡设计可能是不同的。

拟合均值适用于评估由于因子水平变化(而不是由于试验条件不均衡)而产生的响应差异。尽管可以将原始数据与不平衡设计结合使用,大致了解较为明显的主效应,但一般情况下,为了获得更精确的结果,使用拟合均值是比较好的做法。

数据均值与拟合均值的示例

例如,您正在调查时间和温度如何影响化学反应的产量。这两个因子中的每一个都有两个水平,可以产生四种试验条件。这是一种夸张的不平衡试验,目的是强调两种类型的均值之间的差异。除了 50 与 200 时间和温度组合(测量四次)以外,所有的试验条件都测量两次。下表汇总了设计的试验和结果。

表 : 1. 每种试验条件的观测值数
  温度 150 温度 200
时间 20 2 2
时间 50 2 4
表 : 2. 均值(按因子水平)
  数据均值 拟合均值
时间 20 44.01 44.03
时间 50 47.63 47.02
温度 150 44.13 44.14
温度 200 47.55 46.90

“时间 20”和“温度 150”数据均值与拟合均值几乎相同,因为涉及到其中一个或两个因子水平的所有试验条件都准确测量了两次(顶部列表)。但是,“时间 50”与“温度 200”的组合测量了四次,过度表示了它们在原始数据均值中的效应。拟合均值针对这一情况进行调整,并预测平衡设计将产生的结果。