指定 TreeNet® 分类 的默认值

文件 > 选项 > 预测分析  > TreeNet® 分类

指定 的 TreeNet® 分类缺省方法 。对默认设置所做的更改将保留到您再次更改它们,即使退出 Minitab 也是如此。

选择具有二值响应的最优树数量的标准
选择用于生成最优模型的方法。可以对多种方法的结果进行比较,以确定适合应用的最佳选择。
  • 最大对数似然:极大似然方法可用来查找数据似然函数的最大值。
  • ROC 曲线下最大面积:“ROC 曲线下最大面积”方法适用于许多应用。ROC 曲线下面积可衡量模型对各行从最有可能生成事件到最不可能生成事件的排秩效果。此选项适用于二元响应。
  • 最小误分类率:选择此选项可显示将误分类率降至最低的模型的结果。误分类率基于一个简单的计数,即模型正确或错误预测案例的频率。
选择具有多项式响应的最优树数量的标准
选择用于生成最优模型的方法。可以对多种方法的结果进行比较,以确定适合应用的最佳选择。
  • 最小误分类率:选择此选项可显示将误分类率降至最低的模型的结果。误分类率基于一个简单的计数,即模型正确或错误预测案例的频率。
  • 最大对数似然:极大似然方法可用来查找数据似然函数的最大值。
每个树的最大终端节点数最大树深度
您还可以限制树的大小。选择下列选项之一可限制树的大小。
  • 每个树的最大终端节点数:输入介于 2 和 2000 之间的值,以表示树的最大终端节点数。通常,6 在计算速度和变量之间相互作用的研究之间提供了良好的平衡。值 2 排除了交互作用调查。
  • 最大树深度:输入介于 2 和 1000 之间的值,以表示树的最大深度。根节点对应于深度 1。在许多应用中,从 4 到 6 的深度提供良好的模型。
缺失值惩罚
为具有缺失值的预测变量输入惩罚值。由于使用较少的数据更容易成为一个良好拆分变量,因此有缺失数据的预测变量比没有缺失数据的预测变量更有优势。使用此选项对缺失数据的预测变量进行惩罚。
0.0 ≤ K ≤ 2.0,例如:
  • K = 0: 指定不惩罚。
  • K = 2: 指定最高惩罚。
高阶属性惩罚
为具有许多值的类别预测变量输入惩罚值。由于具有许多水平的类别预测变量会因其分裂功效的增加而扭曲一个树,因此它们比具有较少水平的预测变量更有优势。使用此选项对具有多个水平的预测变量进行惩罚。
0.0 ≤ K ≤ 5.0,例如:
  • K = 0: 指定不惩罚。
  • K = 5: 指定最高惩罚。