什么是线性判别分析?

如果某个观测值到组中心(均值)的平方距离(又称为 Mahalanobis 距离)最小,则将该观测值分类到一个组。假定所有组的协方差矩阵均相等。每个组的平方距离公式有一个独特部分,称为该组的“线性判别函数”。对于任何观测值,平方距离最小的组具有最大的线性判别函数,因此,可将观测值分类到此组。

线性判别分析具有对称平方距离的属性:使用组 j 的均值评估的组 i 的线性判别函数等于使用组 i 的均值评估的组 j 的线性判别函数。

这是最简单的情况,没有先验概率或相等协方差矩阵。如果您认为 Mahalanobis 距离是用于度量从观测值到组的距离的合理方法,则不需要就数据的基本分布做任何假设。

Minitab 使用单个共同协方差矩阵来计算观测值与类之间的 Mahalanobis 距离。Minitab 还会计算线性判别函数(类似于回归系数),其可用于对新观测值分类。

注意

假定所有组的协方差矩阵都相等时,可使用线性分析。假定所有组的协方差矩阵不全相等时,可使用二次分析。