使用一般线性模型可确定两个或多个组的均值是否存在差异。可以包括随机因子、协变量或交叉因子与嵌套因子的组合。还可以使用逐步回归来帮助确定模型。然后可以使用模型来预测新观测值的值、标识预测值的组合(这些值一起优化一个或多个拟合值),以及创建曲面图、等值线图和因子图。
对于具有随机因子的模型,您通常使用拟合混合效应模型,以便可以使用约束极大似然估计方法 (REML)。
GLM 是使用最小二乘回归方法执行计算的方差分析过程,目的是描述两个或更多预测变量与连续响应变量之间的统计关系。预测变量可以为因子和协变量。GLM 使用“1、0、- 1”编码方案将因子水平编码为指示变量,然而您可以选择将此方案更改为二进制编码方案 (0, 1)。因子可以是交叉或嵌套的,也可以是固定或随机的。协变量可以彼此交叉或与因子交叉,也可以嵌套在因子内。设计可以是平衡的,也可以是不平衡的。GLM 可以在因子水平均值之间执行多重比较,以找到显著的差异。
假设您正在研究添加剂(具有三个水平的因子)和温度(协变量)对产品涂层厚度的影响。您收集数据并对一般线性模型进行拟合。以下输出是 Minitab 中的部分结果:
由于 p 值小于任何合理的 Alpha 水平,因此有证据表明两个预测变量及其交互作用对强度都有显著影响。此外,模型解释了 99.73% 的方差。协变量、温度的系数表明,当所有其他的预测变量都保持不变时,温度每增加一度,平均强度就增加 83.87 个单位。对于添加剂因子,水平 1 的均值比总体均值低 24.40 个单位,而水平 2 的均值比总体均值低 27.87 个单位。水平 3 是基准值,因此不会显示。计算基准因子水平均值的方法是,将因子的所有水平系数(截距除外)相加,然后乘以 -1。在本例中,因子水平均值比总体均值高 52.27 ((-24.40-27.87) * -1) 个单位。