主成分分析的方法和公式

请选择您所选的方法或公式。

关于本主题

主分量方法
系数的不唯一性
特征向量
分值

特征值
比率
累积比率
Mahalanobis 距离

主分量方法

在主分量分析中，Minitab 首先找到变量相关矩阵或协方差矩阵的正交特征向量集。主分量矩阵是特征向量矩阵与独立变量矩阵的产物。第一个主分量在数据总变异中占比最大，第二个主分量次之，以此类推。主分量的目的在于使用最少数量的分量解释最大量的方差。

系数的不唯一性

如果特征值不同并且不为零，则主分量的系数唯一（符号变化除外）。如果特征值重复，则与同一特征值对应的所有主分量向量的“空间跨度”是唯一的，但单个向量的空间跨度不唯一。因此，尽管特征值（分量的方差）始终相同，但 Minitab 在输出中显示的系数与书籍或其他程序中的系数可能不一致。

如果协方差矩阵的秩 r < p（其中，p 为变量数），则会有 p - r 个特征值等于零。与这些特征值对应的特征向量可能不唯一。如果观测值个数小于 p 或者存在多重共线性，则会出现这种情况。

特征向量

特征向量包括对应于每个变量的系数，是可用于计算主分量分值的每个变量的权重。特征向量在协方差或相关矩阵的频谱分解 S 或 R 中作为正交矩阵的列获取。更具体地说，由于 R 是对称的，正交矩阵 V 存在，使得 V'RV = D 或者，相当于 R = VDV'，其中 D 是对角元素为特征值的对角矩阵。特征向量是 V 的列。特征向量产生于 R = VDV'。