什么是一般线性模型?

使用一般线性模型可确定两个或多个组的均值是否存在差异。可以包括随机因子、协变量或交叉因子与嵌套因子的组合。还可以使用逐步回归来帮助确定模型。然后可以使用模型来预测新观测值的值、标识预测值的组合(这些值一起优化一个或多个拟合值),以及创建曲面图、等值线图和因子图。

注意

对于具有随机因子的模型,您通常使用拟合混合效应模型,以便可以使用约束极大似然估计方法 (REML)。

GLM 是使用最小二乘回归方法执行计算的方差分析过程,目的是描述两个或更多预测变量与连续响应变量之间的统计关系。预测变量可以为因子和协变量。GLM 使用“1、0、- 1”编码方案将因子水平编码为指示变量,然而您可以选择将此方案更改为二进制编码方案 (0, 1)。因子可以是交叉或嵌套的,也可以是固定或随机的。协变量可以彼此交叉或与因子交叉,也可以嵌套在因子内。设计可以是平衡的,也可以是不平衡的。GLM 可以在因子水平均值之间执行多重比较,以找到显著的差异。

一般线性模型的示例

假设您正在研究添加剂(具有三个水平的因子)和温度(协变量)对产品涂层厚度的影响。您收集数据并对一般线性模型进行拟合。以下输出是 Minitab 中的部分结果:

因子信息 因子 类型 水平 值 添加剂 固定 3 1, 2, 3
方差分析 来源 F P 温度 719.21 0.00 添加剂 56.65 0.00 添加剂*温度 69.94 0.00
模型汇总 S R 平方 R 平方(调整) R 平方(预测) 19.1185 99.73% 99.61% 99.39%
系数 项 系数 T P 常量 -4968 -25.97 0.00 温度 83.87 26.82 0.00 添加剂*温度 -0.2852 -22.83 0.00 添加剂 1 -24.40 -5.52 0.00 2 -27.87 -6.30 0.00

由于 p 值小于任何合理的 Alpha 水平,因此有证据表明两个预测变量及其交互作用对强度都有显著影响。此外,模型解释了 99.73% 的方差。协变量、温度的系数表明,当所有其他的预测变量都保持不变时,温度每增加一度,平均强度就增加 83.87 个单位。对于添加剂因子,水平 1 的均值比总体均值低 24.40 个单位,而水平 2 的均值比总体均值低 27.87 个单位。水平 3 是基准值,因此不会显示。计算基准因子水平均值的方法是,将因子的所有水平系数(截距除外)相加,然后乘以 -1。在本例中,因子水平均值比总体均值高 52.27 ((-24.40-27.87) * -1) 个单位。