判别分析输入数据

统计 > 多变量 > 判别分析

输入数据

  1. 中,输入用来只是每个观测值所属组的列。该列可以是数字、文本或日期/时间,最多可以包含 20 个组。
    注意

    如果要更改用于处理文本组的默认字母顺序,可以定义自己的顺序。有关更多信息,请转到更改 Minitab 输出中文本值的显示顺序

  2. 预测变量中,输入包含将用于确定如何区分组的数字测量变量的列。

在该工作表中,跟踪是分组列,指示学校管理员已经为每个学生放置的当前教育成绩记录。测验分数动机是用来确定每个学生的教育成绩记录的预测变量。
C1 C2 C3
成绩记录 检验分值 积极性
3 1021 44
2 1152 56
1 1224 61
3 1077 46
2 1149 55
2 1192 49

判别函数

选择要用于分析的判别函数。

  • 线性:如果可以假定这些组具有相同的协方差矩阵,请执行线性判别分析。有关更多信息,请转到什么是线性判别分析?
  • 二次:如果无法假定这些组具有相同的协方差矩阵,请执行二次判别分析。有关更多信息,请转到什么是二次判别分析?
注意

您可能要使用各个判别函数将分析运行两次,然后比较这些结果以确定哪个函数最适合您的数据。评估判别函数的一种常用方法是比较正确分类的比率。另一种方法是将具有已知组的一些观测值视为组未知,然后确定判别函数预测已知组的效果。

使用交叉验证

选择此选项可补偿乐观的误分类观测值的明显误差率。明显误差率是误分类观测值的百分比。由于分类数据与用于构建分类函数的数据相同,因此该数字往往比较乐观。

通过交叉验证,Minitab 一次可忽略一个观测值,并且使用剩余观测值计算判别函数。然后,Minitab 会预测被忽略观测值的组。如果正确组比率较高,则您可以信任预测值。

如果您使用交叉验证,Minitab 会显示一个附加的汇总表,并将交叉验证信息添加到“误分类观测值汇总”表。

注意

另一种可用于计算更加实际的误差率的方法是将数据分割为两部分。使用一个部分创建判别函数,使用另一个部分作为验证集。预测验证集的组成员,然后将误差率作为误分类数据的百分比进行计算。

存储

可以将分析结果保存到工作表中,以便可以将它们用在其他分析、图形和宏中。Minitab 将选定的结果存储在您输入的列中。拟合与交叉验证拟合的存储列的名称以一个数字结尾,您将这些结果存储多次。

线性判别函数
输入要存储来自线性判别函数的系数的列。为每个组输入一个列。Minitab 为每个函数存储一列,为每个系数存储一行。常量存储在每列的第一行。
拟合值
选择此项可存储拟合值。观测值的拟合值是它将归类的组。Minitab 将组标识符存储在 FITS1 列,且数据中的每个观测值各有一行。
来自交叉验证的拟合值
选择此项可在使用交叉验证执行判别时存储拟合值。观测值的拟合值是它将归类的组。Minitab 将交叉验证的组标识符存储在 XFIT1 列中,且数据中的每个观测值各有一行。