默认情况下,Minitab 使用 (1,0) 编码方案进行回归,但是,您可以选择在编码子对话框中将编码方案更改为 (-1, 0, +1)。有关更多信息,请转到类别预测变量的编码方案。
首先,考虑一个单因子平衡设计,该因子有三个水平。
C1 | C2 - T |
---|---|
响应 | 因子 |
1 | A |
3 | A |
2 | A |
2 | A |
4 | B |
6 | B |
3 | B |
5 | B |
8 | C |
9 | C |
7 | C |
10 | C |
检查描述性统计,主要关注均值。
估计回归方程为:
水平 C 是基准,因此其系数为 0。
与水平 A 相对应的系数为 –6.5。它是水平 A 与基准水平的差值。如果您提取 A 的系数并将其与截距(或基准均值)相加,则将获得水平 A 的均值:–6.5 + 8.5 = 2.0
同样,与水平 B 相对应的系数为 –4.0。它是水平 B 与基准水平之间的差值。如果您提取水平 B 的系数并将其与截距相加,则将获得水平 B 的均值:–4.0 + 8.5 = 4.5
回归方程为:
截距是总体均值。
A 的系数是系数水平 A 的效应。它是水平 A 均值与总体均值之间的差值。
B 的系数是因子水平 B 的效应。它是水平 B 均值与总体均值之间的差值。
得出水平 C 的效应大小的方法是,将所有系数(截距除外)相加,然后乘以 -1:-1 * [(-3.0) + (-0.5)] = 3.5
现在考虑一个双因子平衡设计,第一个因子有三个水平,第二个因子有两个水平。
C1 | C2 - T | C3 - T |
---|---|---|
响应 | 因子 1 | 因子 2 |
1 | A | 高 |
3 | A | 低 |
2 | A | 高 |
2 | A | 低 |
4 | B | 高 |
6 | B | 低 |
3 | B | 高 |
5 | B | 低 |
8 | C | 高 |
9 | C | 低 |
7 | C | 高 |
10 | C | 低 |
检查描述性统计,主要关注均值。
估计回归方程为:
此外,与水平 A 相对应的系数为 –6.5。这仍是水平 A 与基准水平(水平 C)的距离。如果您提取水平 A 的均值并将它减去基准水平的均值,则可以获得系数:2 – 8.5 = -6.5
同样,与水平 B 相对应的系数为 –4.0。它是水平 B 与因子 1 的基准水平的距离。如果您提取水平 B 的均值并将它减去基准水平的均值,则可以获得系数:4.5 - 8.5 = -4.0。
最后,与因子 2 的高水平相对应的系数为“高”与因子 2 的基准水平(低)的距离。因此,如果您提取因子 2 的“高”水平的均值并将它减去因子 2 的基准水平的均值,则获得系数:4.1667 – 5.8333 = -1.667。
请注意,使用此编码方案时,系数与单因子模型中相同。现在,对于第二个因子有一个任务的系数。
回归方程为:
当您仅有两个水平且样本数量相同时,因子效应将在数量级上相等,因为均值正好居中。
截距是总体均值。
系数为每个因子水平的效应。它们代表相应水平的均值与总体均值之间的差值。