选择备择树 - CART®分类

运行预测分析 > CART®分类。单击选择备择树按钮,查看错误分类成本与终端节点数图

概述

默认情况下,Minitab Statistical Software 为误分类成本在最小误分类成本 1 个标准误内的最小树生成输出。Minitab 允许您从可以识别最优树的序列中探索其他树。通常,选择备择树有以下两个原因:
  • 最优树是误分类成本降低的模式的一部分。具有更多个节点的一个或多个树是同一模式的一部分。通常,您希望从树进行预测,并尽可能地提高预测准确度。如果树足够简单,您还可以使用它来了解每个预测变量如何影响响应值。
  • 最优树是误分类成本相对平直的模式的一部分。与最优树相比,模型汇总统计量相似的一个或多个树的节点要少得多。通常,树的终端节点越少,越能清晰地显示每个预测变量如何影响响应值。较小的树也更易于识别一些目标组,以便进一步研究。如果较小树的预测准确度差异可以忽略不计,则也可以使用较小的树来评估响应变量与预测变量之间的关系
例如,在下面的图中,具有 4 个节点的树为最优树。接下来的两个较大的树是误分类成本降低的模式的一部分。
7 节点树的误分类成本低于 4 节点树的成本。由于 7 节点树的复杂度相似,因此可以使用较大的树及其附加的预测准确度来研究重要变量并进行预测。

执行分析

在输出中单击 选择备择树 。将打开一个显示绘图和模型汇总表的对话框。该对话框提供了三种选择备择树的方法:
  • 单击图上的某个点。
  • 单击模型汇总表下的箭头按钮,选择一个比当前所选树更大或更小的树。
  • 单击按钮来选择一个常用的树。当分析不使用验证时,引用标准误的按钮将不适用。
    最小成本
    选择误分类成本最低的树
    1-SE 最小成本
    选择误分类成本在最低成本一个标准误内的最小树。
    2-SE 最小成本
    选择误分类成本在最低成本 2 个标准误内的最小树。
    最佳 ROC
    选择 ROC 曲线下面积最大的树。

单击 创建树 可为您选择的备择树创建和存储结果。针对结果和存储的选择与原始树相同。备择树的图形和表位于新的输出选项卡中。存储的列位于原始数据的工作表中。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策