分析因子设计中模型信息的方法和公式

设计矩阵

Minitab 使用与一般线性模型 (GLM) 中相同的设计矩阵方法,其使用回归来拟合您指定的模型。首先,Minitab 从您指定的因子和模型创建一个设计矩阵。此矩阵的列(称为 X)表示模型中的项。

设计矩阵包含对应于模型中项的 n 行(其中 n = 观测值个数)和几个区组的列。第一个区组用于常量,只包含一列,一个包含所有值的列。连续因子的区组也只包含一列。类别因子的列区组包含 r 列,其中 r = 因子的自由度。

例如,一般全因子设计中的因子可具有 2 个以上的水平。假设 A 是具有 4 个水平的因子。它将有 3 个自由度,它的区组包含 3 列,分别称为 A1、A2、A3。每行的编码如下:

A 的水平 A1 A2 A3
1 1 0 0
2 0 1 0
3 0 0 1
4 -1 -1 -1

要计算交互作用项的列,只需将交互作用中因子的所有对应列相乘即可。例如,假设因子 A 有 6 个水平,C 有 3 个水平,D 有 4 个水平。那么项 A * C * D * 具有 5 x 2 x 3 = 30 个列。要获得这些列,需将 A 的每个列乘以 C 的每个列和 D 的每个列。

效应

为每个因子估计的效应。只会为 2 水平模型计算效应,不会为一般因子模型进行此计算。针对因子效应的公式为:

效应 = 系数 * 2

系数 (Coef)

回归方程中的总体回归系数的估计值。对于每个因子,Minitab 计算 k - 1 个系数,其中 k 是因子中的水平数。对于双因子、2 水平、全因子模型,因子和交互作用的系数公式为:

对于此双因子、2 水平、全因子模型,系数的标准误为:

有关包含两个以上因子或其因子具有两个以上水平的模型的信息,请参见 Montgomery1

表示法

说明
因子 A 的高水平处的 y 的均值
所有观测值的总体均值
因子 B 的高水平处的 y 的均值
因子 A 和 B 的高水平处的 y 的均值
MSE均方误
n估计的项的 - 1 和 1(在协方差矩阵中)的数目

Box-Cox 变换

Box-Cox 变换选择能够最小化残差平方和的 lambda 值(如下所示)。由此生成的变换是 Yλ(当 λ ≠ 0 时)及 ln(Y)(当 λ = 0 时)。当 λ < 0 时,Minitab 还会将变换后响应乘以 −1,以维持未变换响应的顺序。

Minitab 搜索介于 −2 和 2 之间的最优值。此区间以外的值生成的拟合可能较差。

以下是一些常见的变换,其中 Y' 是数据 Y 的变换:

Lambda (λ) 值 变换
λ = 2 Y′ = Y 2
λ = .5 Y′ =
λ = 0 Y′ = ln(Y )
λ = −.5
λ = −1 Y′ = −1 / Y

加权回归

加权最小二乘回归是处理具有非恒定方差的观测值的方法。如果方差不是恒定的,则观测值应具备以下特点:

  • 应当为较大的方差指定相对较小的权重
  • 应当为较小的方差指定相对较大的权重

权重的常用选项是响应中纯误差方程之逆。

估计系数的公式如下所示:
这相当于将加权 SS 误差最小化。

表示法

说明
X设计矩阵
X'转置设计矩阵
W对角线上的 n x n 权重矩阵
Y响应值向量
n观测值个数
wi第 i 个响应值的权重
yi第 i 个观测值的响应值
第 i 个观测值的拟合值
1 D. C. Montgomery (1991) Design and Analysis of Experiments(试验的设计和分析),第三版,John Wiley & Sons
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策