平方和表示对距离均值的变异或离差的度量。计算方法是与均值之差的平方之和。计算总平方和时,同时考虑来自因子和来自随机性或误差的平方和。
在方差分析 (ANOVA) 中,总平方和有助于表达可能因不同因子所致的总变异。例如,运行试验以检验三种洗衣粉的效果。
总平方和 = 处理平方和 (SST) + 残差误差平方和 (SSE)
处理平方和是因处理(在此例中为洗衣粉之间的不同)所致的变异。残差误差平方和是因误差所致的变异。
通过除以自由度将平方和转换为均方,可以对这些比率进行比较,并确定是否因洗衣粉而导致显著差异。此比率越大,处理对结果的影响越大。
在回归中,总平方和有助于表达 y 的总变异。例如,您收集数据以确定将总体销售解释为广告预算函数的模型。
总平方和 = 回归平方和 (SSR) + 残差误差平方和 (SSE)
回归平方和是因 x 与 y 之间关系(本例中为广告预算与销售额之间)所致的变异。残差误差平方和是因误差所致的变异。
通过将回归平方和与总平方和进行比较,确定总变异中由回归模型解释的比率(R2,确定性系数)。此值越大,将销售额解释为广告预算的函数的关系越好。
连续平方和取决于将因子输入到模型中的顺序。在给定以前输入的因子的情况下,连续平方和是 SS 回归中唯一由因子解释的部分。
例如,如果模型有三个因子 X1、X2 和 X3,在 X1 已经在模型中的情况下,X2 的连续平方和显示 X2 解释的其余变异的量。要获得不同的因子序列,请重复回归过程,以不同顺序输入因子。
调整的平方和并不取决于将因子输入到模型中的顺序。在给定模型中所有其他因子的情况下,这是 SS 回归中唯一由因子解释的部分,与将因子输入到模型中的顺序无关。
例如,如果模型有三个因子 X1、X2 和 X3,在 X1 和 X3 已经在模型中的情况下,X2 的调整的平方和显示 X2 解释的其余变异的量。
模型中的最后一项的连续平方和与调整平方和总是相同。例如,如果您的模型包含项 A、B 和 C(以此顺序排列),那么 C 的两个平方和表示当 C 被添加到包含 A 和 B 的模型时,会发生残差误差平方和减少。
如果设计矩阵是正交,则所有项的连续平方和与调整平方和均相同。这一情况发生的最常见的情况是,在进行编码单元分析时,采用因子和部分因子设计(无协变量)。在这些设计中,所有主效应和交互作用项的设计矩阵中的列均为彼此正交。Plackett-Burman 设计具有主效应正交列(通常仅为模型中的项),但如果存在任何交互作用项,可能会与其他项部分混淆(即,非正交)。在响应曲面设计中,平方项的列彼此不正交。
对于任何设计,如果设计矩阵为非编码单元,则具有非正交的列,除非因子水平仍以零为中心。
调整平方和可能小于、等于或大于连续平方和。
假设您要将模型与项 A、B、C 和 A*B 拟合。当 A、B、C 和 A*B 在模型中时,设 SS (A,B,C, A*B) 为平方和。当模型中包含 A、B 和 C 时,设 SS (A, B, C) 为平方和。然后,A*B 的调整平方和为:
SS(A, B, C, A*B) - SS(A, B, C)
但是,当模型中具有相同的项 A、B、C、A*B,A*B 的连续平方和取决于在模型中指定项的顺序。
使用相似的表示法时,如果顺序为 A、B、A*B、C,则 A*B 的连续平方和为:
SS(A, B, A*B) - SS(A, B)
求一列中每一个值的平方,然后计算这些平方值的和。也就是说,如果列包含 x1, x2, ... , xn,则平方和会计算 (x12 + x22+ ... + xn2)。与校正的平方和不同,未校正的平方和包含误差。数据值将直接计算平方,而不先减去均值。
在 Minitab 中,您可以使用描述性统计量来显示未校正平方和。您也可以使用计算器中的平方和 (SSQ) 函数来计算一列或一行的未校正平方和。例如,您正在手动计算公式,并且要获得一组响应 (y) 变量的平方和。
在计算器中,输入表达式:SSQ (C1)
将结果存储在 C2 中,以查看未校正的平方和。以下工作表显示了使用计算器计算列 y 的平方和的结果。
C1 | C2 |
---|---|
y | 平方和 |
2.40 | 41.5304 |
4.60 | |
2.50 | |
1.60 | |
2.20 | |
0.98 |
Minitab 会在计算此函数时忽略缺失值。