默认情况下,Minitab 显示误分类成本在最低成本 1 个标准误内的最小树。
根节点是树的顶部节点。它是唯一没有父节点的节点。在每个节点处,数据都会根据其特征分裂为两个子节点。例如,心脏病患者是否有运动性心绞痛?节点继续分裂,直到树中要分裂的数据用完为止。换句话说,终端节点无法再为了进一步分组而进行分裂。
使用检验数据集验证树的性能时,树状图将显示训练数据集中的案例。
树状图中终端节点的路径描述了如何形成更纯的组。终端节点提供有关如何使用预测变量定义每个更纯组,以便进一步研究的信息。每个节点都包含有关类别、计数和类别中百分比的详细信息。
终端节点中包含的信息还提供一种按类别概率对所有更纯组进行排名的方法,以便您集中精力。