Minitab 中的一般线性模型 (GLM) 设计矩阵

一般线性模型使用回归方法来拟合您指定的模型。首先,Minitab 会根据因子和协变量以及您指定的模型创建一个设计矩阵。此矩阵的列即是回归的预测变量。

对于模型中的每一项,设计矩阵都有 n 行(其中,n = 观测值数)和一个列区组,通常称为指示符变量。区组中的列数与该项的自由度数相同。第一个区组用于常量,只包含一列(一个包含所有值的列)。用于协变量的区组也只包含一列,即协变量列本身。

假设 A 是具有 4 个水平的因子,并且模型使用 -1、0、+1 编码。它将有 3 个自由度,它的区组包含 3 列,分别称为 A1、A2、A3。每行的编码如下:
A 的水平 A1 A2 A3
1 1 0 0
2 0 1 0
3 0 0 1
4 -1 -1 -1
假设因子 B 具有在每个 A 水平中嵌套的 3 个水平。它的区组将包含 (3 - 1) x 4 = 8 个列,分别称为 B11、B12、B21、B22、B31、B32、B41、B42,如下所示进行编码:
A 的水平 B 的水平 B11 B12 B21 B22 B31 B32 B41 B42
1 1 1 0 0 0 0 0 0 0
1 2 0 1 0 0 0 0 0 0
1 3 -1 -1 0 0 0 0 0 0
2 1 0 0 1 0 0 0 0 0
2 2 0 0 0 1 0 0 0 0
2 3 0 0 -1 -1 0 0 0 0
3 1 0 0 0 0 1 0 0 0
3 2 0 0 0 0 0 1 0 0
3 3 0 0 0 0 -1 -1 0 0
4 1 0 0 0 0 0 0 1 0
4 2 0 0 0 0 0 0 0 1
4 3 0 0 0 0 0 0 -1 -1

要计算交互作用项的指示符变量,只需将交互作用项中因子和/或协变量的所有对应虚拟变量相乘即可。例如,假设因子 A 有 6 个水平,C 有 3 个水平,D 有 4 个水平,Z 和 W 是协变量。那么项 A * C * D * Z * W * W 就有 5 x 2 x 3 x 1 x 1 x 1 = 30 个指示符变量。要获得这些变量,需要将 A 的每个指示符变量乘以 C 的每个指示符变量和 D 的每个指示符变量,然后再乘以协变量 Z 一次,W 两次。