什么是广义线性模型?

广义线性模型和最小二乘回归均用于探究响应变量与一个或多个预测变量之间的关系。它们之间的实际区别在于广义线性模型技术通常与类别响应变量一起使用。最小二乘回归技术通常与连续响应变量一起使用。有关广义线性模型的详细描述,请参见1

广义线性模型技术和最小二乘回归技术均用于估计模型中的参数,从而优化模型的拟合。最小二乘回归可以最小化误差平方和,从而得到参数的极大似然估计。广义线性模型使用迭代重加权最小二乘算法来获得参数的极大似然估计值。

例如,您可以使用广义线性模型来研究机械师的经验年份(非负连续变量)与他们参与某个可选培训项目(一个二元变量:可为是或否)之间的关系,以预测他们的产品是否符合规格(一个二元变量:可为是或否)。前两个变量是预测变量,第三个变量是类别响应。

Logistic 回归的类型

Minitab 统计软件可提供四种广义线性模型技术,您可以用它们来评估以下类型的一个或多个预测变量和响应变量之间的关系。前面的示例因响应变量有两个水平而使用二元 Logistic 回归。

变量类型 类别数 特征 示例

二进制

2

两个水平

通过/失败

是/否

高/低

顺序

3 及以上

各水平的自然排序

口味(微辣、中辣、重辣)

疾病状况(危险、严重、稳定、良好)

调查结果(不同意、中立、同意)

名义

3 及以上

无各水平的自然排序

口味(苦、甜、酸)

颜色(红、蓝、黑)

学校科目(数学、自然科学、艺术)

Poisson

3 及以上

响应变量描述事件在有限观测空间中出现的次数。

0, 1, 2, ...
注意

对于具有一个连续预测变量和一个二元响应变量的模型,Minitab 可提供第五种技术。二元拟合线图可简单地描述预测变量和响应之间的关系。

1 P. McCullagh 和 J. A. Nelder (1992)。广义线性模型。Chapman & Hall。