主成分分析输入数据

统计 > 多变量 > 主成份

为您的分析指定数据,输入要计算的分量数,并且指定矩阵类型。

输入数据

变量中,指定要分析的数据列。必须有两个或更多数值数据列,且每列代表不同的测量值。如果任一列存在缺失值,Minitab 将忽略整个行。Minitab 将从相关矩阵或协方差矩阵的计算中排除缺失值。

在此工作表中,每个列包含针对贷款申请的不同类型信息的测量值。

C1 C2 C3 C4 C5 C6 C7 C8
收入 教育程度 年龄 居住年限 服务处所 存款 外债 信用卡数
50000 16 28 2 2 5000 1200 2
72000 18 35 10 8 12000 5400 4
61000 18 36 6 5 15000 1000 2
88000 20 35 4 4 980 1100 4
91100 18 38 8 9 20000 0 1
45100 14 41 15 14 3900 22000 4

要计算的分量数

输入要让 Minitab 计算的主分量数。如果您有大量的变量,可能要指定较少的分量以减少输出量。如果不知道要输入多少分量,可将此字段留为空白。如果未指定数量,Minitab 会计算最大分量数,其等于变量数。之后,您可以使用输出确定多少分量解释原始变量中的大部分变异。

矩阵类型

选择要用来计算主分量的矩阵类型。

  • 相关:当您的变量具有不同尺度且您希望均等地为所有变量分配权重时使用。例如,如果某些变量使用 1-5 的尺度,而其他变量使用 1-10 的尺度,请使用相关矩阵标准化尺度。
  • 协方差:当您的变量使用相同尺度时,或者当您的变量具有不同尺度但您希望为方差较高的变量分配更大权重时使用。

例如,假定您计算几个样本站点的不同生物种类数量。如果您选择协方差矩阵,常见种类越多将显示更高的方差和更高的权重。非常稀有的种类对分析结果影响不大。如果您选择相关矩阵,所有种类的权重均等。因此,非常稀有的种类对分析结果影响很大。因此,决定取决于您研究的目标。