解释判别分析的所有统计量和图形

请查找相关定义和解释指导,了解随判别分析提供的每个统计量和图形。

实际组

将观测值分类到其中的实际组。实际组根据工作表分组列中的值确定。

解释

要评估每个组的观测值分类,请比较置入观测值的这些组与其实际组。

分类汇总


实际组
置入组123
15950
21533
30257
合计 N606060
正确 N 595357
比率0.9830.8830.950

此“分类汇总”表的列 2 显示 53 个观测值已正确分配到组 2。但是,来自组 2 的 5 个观测值置入组 1,来自组 2 的 2 个观测值置入组 3。因此,来自组 2 的观测值中的 7 个观测值错误地分类到了其他组。

误分类观测值的汇总

观测值实际组预测组平方距离概率
4**1213.5240.438
      23.0280.562
      325.5790.000
65**2112.7640.677
      24.2440.323
      329.4190.000
71**2113.3570.592
      24.1010.408
      327.0970.000
78**2112.3270.775
      24.8010.225
      329.6950.000
79**2111.5280.891
      25.7320.109
      332.5240.000
100**2115.0160.878
      28.9620.122
      338.2130.000
107**23139.02260.000
      27.36040.032
      30.52490.968
116**23131.8980.000
      27.9130.285
      36.0700.715
123**32130.1640.000
      25.6620.823
      38.7380.177
124**32126.3280.000
      24.0540.918
      38.8870.082
125**32128.5420.000
      23.0590.521
      33.2300.479

此“误分类汇总”表的行 1 显示预计观测值 4 属于组 2,但实际属于组 1。

置入组

根据判别分析预测观测值所属的组。

解释

要评估每个组的观测值分类,请比较观测值置入的组及其实际组。例如,以下“分类汇总”表的行 2 显示合计的 1 + 53 + 3 = 57 个观测值置入组 2。在这 57 个观测值中,53 个观测值正确分配到组 2。但是,置入组 2 的 1 个观测值实际来自组 1,置入组 2 的 3 个观测值实际来自组 3。因此,这些观测值中预测属于组 2 的 4 个观测值实际来自其他组。

分类汇总


实际组
置入组123
15950
21533
30257
合计 N606060
正确 N 595357
比率0.9830.8830.950

合计 N

每个实际组中的观测值总数。

正确 N

正确归入每个实际组的观测值个数。Minitab 会显示每个实际组的正确 N 和所有组的合计正确 N。

解释

使用正确 N 值可确定数据集中有多少个观测值预测属于分配到的组。例如,对于组 1,假定正确 N 值为 52 且合计 N 值为 60。这说明根据工作表分组列中的值,60 个值被认为属于组 1。在这 60 个观测值中,根据用于分析的判别函数,有 52 个预测属于组 1。因此,正确归入各个实际组的观测值个数为 52。

比率

正确归入每个实际组的观测值比率。

解释

使用正确归入每个组的观测值比率可评估您的观测值分类效果。例如,“分类汇总”表中的比率显示以下内容:

  • 组 1 中 98.3% 的观测值正确归入。
  • 组 2 中 88.3% 的观测值正确归入。
  • 组 3 中 95% 的观测值正确归入。

因此,将观测值分类到组 2 问题最多。

分类汇总


实际组
置入组123
15950
21533
30257
合计 N606060
正确 N 595357
比率0.9830.8830.950

N

数据集中非缺失值的数量。N 等于所有组中的观测值总数。

正确比率

所有组的正确分类比率。正确归入的观测值个数(正确 N)除以观测值总数 (N) 即可得到此值。

组之间的平方距离

从一个组中心(均值)到另一个组中心(均值)的平方距离。如果某个观测值的平方距离(又称为 Mahalanobis 距离)到组中心(均值)的距离最小,则将该观测值分类到组中。

注意

如果使用二次函数,Minitab 将显示“广义平方距离”表。有关使用如何计算每个函数的平方距离的更多信息,请转至判别分析的距离和判别函数

解释

这些距离值本身信息量并不是非常大,但是可以比较距离来查看组之间的差异。例如,下面的结果指出组 1 和组 3 之间的距离最大 (48.0911)。组 1 和组 2 之间的差值为 12.9853,组 2 和组 3 之间的差值为 11.3197。

组之间的平方距离

123
10.000012.985348.0911
212.98530.000011.3197
348.091111.31970.0000

组的线性判别函数

组的线性判别函数指示与每个组相关联的线性方程。每个组的线性判别得分对应于多元回归分析中的回归系数。

解释

使用组的线性判别函数可确定组间预测变量的差异。例如,当存在三个组时,Minitab 将估计某个函数,在下列组之间进行判别:
  • 组 1 与组 2 和组 3
  • 组 2 与组 1 和组 3
  • 组 3 与组 1 和组 2

线性判别函数最大的组或回归系数对观测值分类的影响最大。例如,在下面的结果中,组 1 具有最大的检验分值线性判别函数 (17.4),这表示在对组成员资格进行分类方面,组 1 的检验分值的贡献比组 2 或组 3 大。组 3 具有最大的动机线性判别函数,这表示在对组成员资格进行分类方面,组 3 的贡献比组 1 或组 2 大。

组的线性判别函数

123
常量-9707.5-9269.0-8921.1
测验分数17.417.016.7
动机-3.2-3.7-4.3

合并均值

合并均值是每个实际组的均值的加权均值。要显示合并均值,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总

解释

使用合并均值可描述数据中所有观测值的中心。例如,在下面的结果中,所有组的总检验分值是 1102.1。

组均值



组的均值
变量合并均值123
测验分数1102.11127.41100.61078.3
动机47.05653.60047.41740.150

组的均值

每个实际组中值的和除以每个实际组中(非缺失)值的数量。要显示组的均值,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总

解释

使用组均值可以借助于表示数据中心的单个值来描述每个实际组。例如,在下面的结果中,组 1 具有最高的均值检验分值 (1127.4),而组 3 具有最低的均值检验分值 (1078.3)。组 2 的均值检验分值位于中间 (1100.6)。

组均值



组的均值
变量合并均值123
测验分数1102.11127.41100.61078.3
动机47.05653.60047.41740.150

合并标准差

合并标准差是每个实际组的标准差的加权平均值。要显示合并标准差,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总

解释

使用合并标准差可以确定单个数据点围绕其实际组均值展开的程度。例如,在下面的结果中,所有组的检验分值的合并标准差为 8.109。

组标准差



组的标准差
变量合并标准差123
测验分数8.1098.3089.2666.511
动机2.9942.4093.2433.251

组的标准差

离差的最常用度量,即数据围绕均值展开的程度。组的标准差是每个实际组的标准差。要显示组的标准差,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总

解释

使用组的标准差可以确定数据从每个实际组的均值展开的程度。例如,在下面的结果中,组 2 的检验分值具有最高的标准差 (9.266)。这说明组 2 的检验分值在这三个组中具有最大的变异性。在这三个组中,组 3 具有最低的标准差 (6.511) 和最低的检验分值变异性。

组标准差



组的标准差
变量合并标准差123
测验分数8.1098.3089.2666.511
动机2.9942.4093.2433.251

合并协方差矩阵

所有组中全部测量值之间关系的加权矩阵。合并协方差矩阵的计算方法是通过对单个组协方差矩阵元素逐一求平均值。

要显示合并协方差矩阵,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总

协方差矩阵

表明每对变量之间关系的非标准化矩阵。协方差类似于相关系数,后者是协方差除以变量标准差的积得出的值。

要显示每个组的协方差矩阵,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总

观测值

每个观测值的观测值个数。观测值个数对应于 Minitab 工作表中的分类观测值行。如果观测值误分类(即,如果预测组与实际组不同),Minitab 会在观测值个数后面显示 **。

要查看数据集中每个观测值的预测组和实际组,必须单击选项并在执行分析时选择以上加完整的分类汇总

预测组

各个观测值的预测组是 Minitab 根据预测的平方距离分配到观测值的组成员。要查看数据集中各个观测值的预测组和实际组,必须单击选项并在执行分析时选择以上加完整的分类汇总

解释

比较每个观测值的预测组和实际组可确定观测值是否正确分类。如果预测组与实际组不同,那么观测值误分类。

X 值组

使用交叉验证 (X-val) 的预测组是 Minitab 根据使用交叉验证预测的平方距离分配到观测值的组成员。要查看各个观测值的使用交叉验证的预测组,必须选择主对话框中的使用交叉验证,然后单击选项,并在执行分析时选择以上加完整的分类汇总

解释

比较每个观测值的预测组(使用交叉验证)和实际组可确定观测值是否正确分类。如果使用交叉验证的预测组与实际组不同,那么观测值误分类。

重要信息

使用交叉验证的预测组忽略了一个观测值,以创建判别规则,然后查看该规则是否适用于该特定观测值。当您不使用交叉验证时,您可以通过使用观测值创建规则而偏倚该判别规则。

平方距离

每个组的各个观测值的预测平方距离值。平方距离值表示观测值与每个组均值的距离。要查看数据中各个观测值的平方距离,必须单击选项并在执行分析时选择以上加完整的分类汇总

注意

如果您在执行分析时使用交叉验证,Minitab 会计算出使用交叉验证 (X-val) 和不使用交叉验证 (Pred) 的情况下各个观测值的预测平方距离。有关如何计算平方距离的更多信息,请转到判别分析的距离和判别函数