将观测值分类到其中的实际组。实际组根据工作表分组列中的值确定。
要评估每个组的观测值分类,请比较置入观测值的这些组与其实际组。
实际组 | |||
---|---|---|---|
置入组 | 1 | 2 | 3 |
1 | 59 | 5 | 0 |
2 | 1 | 53 | 3 |
3 | 0 | 2 | 57 |
合计 N | 60 | 60 | 60 |
正确 N | 59 | 53 | 57 |
比率 | 0.983 | 0.883 | 0.950 |
此“分类汇总”表的列 2 显示 53 个观测值已正确分配到组 2。但是,来自组 2 的 5 个观测值置入组 1,来自组 2 的 2 个观测值置入组 3。因此,来自组 2 的观测值中的 7 个观测值错误地分类到了其他组。
观测值 | 实际组 | 预测组 | 组 | 平方距离 | 概率 |
---|---|---|---|---|---|
4** | 1 | 2 | 1 | 3.524 | 0.438 |
2 | 3.028 | 0.562 | |||
3 | 25.579 | 0.000 | |||
65** | 2 | 1 | 1 | 2.764 | 0.677 |
2 | 4.244 | 0.323 | |||
3 | 29.419 | 0.000 | |||
71** | 2 | 1 | 1 | 3.357 | 0.592 |
2 | 4.101 | 0.408 | |||
3 | 27.097 | 0.000 | |||
78** | 2 | 1 | 1 | 2.327 | 0.775 |
2 | 4.801 | 0.225 | |||
3 | 29.695 | 0.000 | |||
79** | 2 | 1 | 1 | 1.528 | 0.891 |
2 | 5.732 | 0.109 | |||
3 | 32.524 | 0.000 | |||
100** | 2 | 1 | 1 | 5.016 | 0.878 |
2 | 8.962 | 0.122 | |||
3 | 38.213 | 0.000 | |||
107** | 2 | 3 | 1 | 39.0226 | 0.000 |
2 | 7.3604 | 0.032 | |||
3 | 0.5249 | 0.968 | |||
116** | 2 | 3 | 1 | 31.898 | 0.000 |
2 | 7.913 | 0.285 | |||
3 | 6.070 | 0.715 | |||
123** | 3 | 2 | 1 | 30.164 | 0.000 |
2 | 5.662 | 0.823 | |||
3 | 8.738 | 0.177 | |||
124** | 3 | 2 | 1 | 26.328 | 0.000 |
2 | 4.054 | 0.918 | |||
3 | 8.887 | 0.082 | |||
125** | 3 | 2 | 1 | 28.542 | 0.000 |
2 | 3.059 | 0.521 | |||
3 | 3.230 | 0.479 |
此“误分类汇总”表的行 1 显示预计观测值 4 属于组 2,但实际属于组 1。
根据判别分析预测观测值所属的组。
要评估每个组的观测值分类,请比较观测值置入的组及其实际组。例如,以下“分类汇总”表的行 2 显示合计的 1 + 53 + 3 = 57 个观测值置入组 2。在这 57 个观测值中,53 个观测值正确分配到组 2。但是,置入组 2 的 1 个观测值实际来自组 1,置入组 2 的 3 个观测值实际来自组 3。因此,这些观测值中预测属于组 2 的 4 个观测值实际来自其他组。
实际组 | |||
---|---|---|---|
置入组 | 1 | 2 | 3 |
1 | 59 | 5 | 0 |
2 | 1 | 53 | 3 |
3 | 0 | 2 | 57 |
合计 N | 60 | 60 | 60 |
正确 N | 59 | 53 | 57 |
比率 | 0.983 | 0.883 | 0.950 |
每个实际组中的观测值总数。
正确归入每个实际组的观测值个数。Minitab 会显示每个实际组的正确 N 和所有组的合计正确 N。
使用正确 N 值可确定数据集中有多少个观测值预测属于分配到的组。例如,对于组 1,假定正确 N 值为 52 且合计 N 值为 60。这说明根据工作表分组列中的值,60 个值被认为属于组 1。在这 60 个观测值中,根据用于分析的判别函数,有 52 个预测属于组 1。因此,正确归入各个实际组的观测值个数为 52。
正确归入每个实际组的观测值比率。
使用正确归入每个组的观测值比率可评估您的观测值分类效果。例如,“分类汇总”表中的比率显示以下内容:
因此,将观测值分类到组 2 问题最多。
实际组 | |||
---|---|---|---|
置入组 | 1 | 2 | 3 |
1 | 59 | 5 | 0 |
2 | 1 | 53 | 3 |
3 | 0 | 2 | 57 |
合计 N | 60 | 60 | 60 |
正确 N | 59 | 53 | 57 |
比率 | 0.983 | 0.883 | 0.950 |
数据集中非缺失值的数量。N 等于所有组中的观测值总数。
所有组的正确分类比率。正确归入的观测值个数(正确 N)除以观测值总数 (N) 即可得到此值。
从一个组中心(均值)到另一个组中心(均值)的平方距离。如果某个观测值的平方距离(又称为 Mahalanobis 距离)到组中心(均值)的距离最小,则将该观测值分类到组中。
如果使用二次函数,Minitab 将显示“广义平方距离”表。有关使用如何计算每个函数的平方距离的更多信息,请转至判别分析的距离和判别函数。
这些距离值本身信息量并不是非常大,但是可以比较距离来查看组之间的差异。例如,下面的结果指出组 1 和组 3 之间的距离最大 (48.0911)。组 1 和组 2 之间的差值为 12.9853,组 2 和组 3 之间的差值为 11.3197。
1 | 2 | 3 | |
---|---|---|---|
1 | 0.0000 | 12.9853 | 48.0911 |
2 | 12.9853 | 0.0000 | 11.3197 |
3 | 48.0911 | 11.3197 | 0.0000 |
组的线性判别函数指示与每个组相关联的线性方程。每个组的线性判别得分对应于多元回归分析中的回归系数。
线性判别函数最大的组或回归系数对观测值分类的影响最大。例如,在下面的结果中,组 1 具有最大的检验分值线性判别函数 (17.4),这表示在对组成员资格进行分类方面,组 1 的检验分值的贡献比组 2 或组 3 大。组 3 具有最大的动机线性判别函数,这表示在对组成员资格进行分类方面,组 3 的贡献比组 1 或组 2 大。
1 | 2 | 3 | |
---|---|---|---|
常量 | -9707.5 | -9269.0 | -8921.1 |
测验分数 | 17.4 | 17.0 | 16.7 |
动机 | -3.2 | -3.7 | -4.3 |
合并均值是每个实际组的均值的加权均值。要显示合并均值,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总。
使用合并均值可描述数据中所有观测值的中心。例如,在下面的结果中,所有组的总检验分值是 1102.1。
组的均值 | ||||
---|---|---|---|---|
变量 | 合并均值 | 1 | 2 | 3 |
测验分数 | 1102.1 | 1127.4 | 1100.6 | 1078.3 |
动机 | 47.056 | 53.600 | 47.417 | 40.150 |
每个实际组中值的和除以每个实际组中(非缺失)值的数量。要显示组的均值,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总。
使用组均值可以借助于表示数据中心的单个值来描述每个实际组。例如,在下面的结果中,组 1 具有最高的均值检验分值 (1127.4),而组 3 具有最低的均值检验分值 (1078.3)。组 2 的均值检验分值位于中间 (1100.6)。
组的均值 | ||||
---|---|---|---|---|
变量 | 合并均值 | 1 | 2 | 3 |
测验分数 | 1102.1 | 1127.4 | 1100.6 | 1078.3 |
动机 | 47.056 | 53.600 | 47.417 | 40.150 |
合并标准差是每个实际组的标准差的加权平均值。要显示合并标准差,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总。
使用合并标准差可以确定单个数据点围绕其实际组均值展开的程度。例如,在下面的结果中,所有组的检验分值的合并标准差为 8.109。
组的标准差 | ||||
---|---|---|---|---|
变量 | 合并标准差 | 1 | 2 | 3 |
测验分数 | 8.109 | 8.308 | 9.266 | 6.511 |
动机 | 2.994 | 2.409 | 3.243 | 3.251 |
离差的最常用度量,即数据围绕均值展开的程度。组的标准差是每个实际组的标准差。要显示组的标准差,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总。
使用组的标准差可以确定数据从每个实际组的均值展开的程度。例如,在下面的结果中,组 2 的检验分值具有最高的标准差 (9.266)。这说明组 2 的检验分值在这三个组中具有最大的变异性。在这三个组中,组 3 具有最低的标准差 (6.511) 和最低的检验分值变异性。
组的标准差 | ||||
---|---|---|---|---|
变量 | 合并标准差 | 1 | 2 | 3 |
测验分数 | 8.109 | 8.308 | 9.266 | 6.511 |
动机 | 2.994 | 2.409 | 3.243 | 3.251 |
所有组中全部测量值之间关系的加权矩阵。合并协方差矩阵的计算方法是通过对单个组协方差矩阵元素逐一求平均值。
要显示合并协方差矩阵,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总。
表明每对变量之间关系的非标准化矩阵。协方差类似于相关系数,后者是协方差除以变量标准差的积得出的值。
要显示每个组的协方差矩阵,必须单击选项并在执行分析时选择以上加均值、标准差和协方差汇总。
每个观测值的观测值个数。观测值个数对应于 Minitab 工作表中的分类观测值行。如果观测值误分类(即,如果预测组与实际组不同),Minitab 会在观测值个数后面显示 **。
要查看数据集中每个观测值的预测组和实际组,必须单击选项并在执行分析时选择以上加完整的分类汇总。
各个观测值的预测组是 Minitab 根据预测的平方距离分配到观测值的组成员。要查看数据集中各个观测值的预测组和实际组,必须单击选项并在执行分析时选择以上加完整的分类汇总。
比较每个观测值的预测组和实际组可确定观测值是否正确分类。如果预测组与实际组不同,那么观测值误分类。
使用交叉验证 (X-val) 的预测组是 Minitab 根据使用交叉验证预测的平方距离分配到观测值的组成员。要查看各个观测值的使用交叉验证的预测组,必须选择主对话框中的使用交叉验证,然后单击选项,并在执行分析时选择以上加完整的分类汇总。
比较每个观测值的预测组(使用交叉验证)和实际组可确定观测值是否正确分类。如果使用交叉验证的预测组与实际组不同,那么观测值误分类。
使用交叉验证的预测组忽略了一个观测值,以创建判别规则,然后查看该规则是否适用于该特定观测值。当您不使用交叉验证时,您可以通过使用观测值创建规则而偏倚该判别规则。
每个组的各个观测值的预测平方距离值。平方距离值表示观测值与每个组均值的距离。要查看数据中各个观测值的平方距离,必须单击选项并在执行分析时选择以上加完整的分类汇总。
如果您在执行分析时使用交叉验证,Minitab 会计算出使用交叉验证 (X-val) 和不使用交叉验证 (Pred) 的情况下各个观测值的预测平方距离。有关如何计算平方距离的更多信息,请转到判别分析的距离和判别函数。