树状图 - CART® 分类

默认情况下,Minitab 显示误分类成本在最低成本 1 个标准误内的最小树。

右键单击树状图可执行以下交互:
  • 突出显示 5 个最纯节点。这些节点为最优节点。
  • 复制指向所选节点的预测变量的值。这些值是节点规则。
  • 显示节点分裂视图。当您有一个大型树并且只想查看哪些变量分裂节点时,此视图非常有用。

根节点是树的顶部节点。它是唯一没有父节点的节点。在每个节点处,数据都会根据其特征分裂为两个子节点。例如,心脏病患者是否有运动性心绞痛?节点继续分裂,直到树中要分裂的数据用完为止。换句话说,终端节点无法再为了进一步分组而进行分裂。

使用检验数据集验证树的性能时,树状图将显示训练数据集中的案例。

解释

树状图中终端节点的路径描述了如何形成更纯的组。终端节点提供有关如何使用预测变量定义每个更纯组,以便进一步研究的信息。每个节点都包含有关类别、计数和类别中百分比的详细信息。

终端节点中包含的信息还提供一种按类别概率对所有更纯组进行排名的方法,以便您集中精力。

节点 ID
指定节点或终端节点。终端节点是无法进一步分裂的最终节点。
类别
每个终端节点都有一个基于类别分配规则的特定类别分配。对于二值响应,类别可以是“是”或“否”。对于多项式响应,类别可以是“Q1”、“Q2”、“Q3”和“Q4”。
计数
特定类别的案例数。
百分比
特定类别的案例百分比。
总计数
所有类别的计数总和。