树状图 - CART® 回归

默认情况下,Minitab 显示 R2 值在最大 R2 值一个标准误内的最小树。

右键单击树状图可执行以下交互:
  • 突出显示从节点拟合值变异最小的 5 个节点。这些节点为最优节点。
  • 根据树的标准,突出显示 5 个均值或中位数最高的节点。
  • 根据树的标准,突出显示 5 个均值或中位数最低的节点。
  • 复制产生所选节点的预测变量的值。这些值是节点规则。
  • 显示节点分裂视图。当您有一个大型树并且只想查看哪些变量分裂节点时,此视图非常有用。

根节点是树的顶部节点,也是唯一没有父节点的节点。在每个节点处,数据都会根据其特征分裂为两个子节点。节点继续分裂,直到树中的数据用完无法分裂为止。换句话说,终端节点无法再为了进一步分组而进行分裂。

使用检验数据集验证树的性能时,树状图将显示训练数据集中的案例。

解释

每个节点都包含有关均值、标准差和计数的详细信息。

节点 ID
指定节点或终端节点。终端节点是无法进一步分裂的最终节点。
均值
均值是节点中案例的平均响应值。平均值是位于同一节点中的新数据的预测值。与其他终端节点的均值相差最大的终端节点可能需要特殊关注,因为这些终端节点中的案例的预测差异最大。例如,最大或最小均值可能需要特殊关注。
标准差
标准差是节点中响应值的标准偏差。标准差较小的终端节点可能需要特殊关注,因为这些节点的预测比标准差较大的终端节点更精确。
总计数
总计数是节点中的案例数。如果分析包含权重,则计数为总加权计数。具有许多案例的终端节点可能需要特殊关注,因为这些节点通常表示更常见的案例。