按终端节点的残差图 - CART® 回归

残差以图形方式汇总了每个节点的误差。该图简化了各节点准确度的比较。

解释

残差汇总了节点的误差,有助于识别拟合不佳的案例。对于相对于响应变量尺度具有较小残差的节点,其拟合的置信度最高。残差散步较广的节点可以代表减少或解释更多变异的机会。您可以选择是否调查图案显示异常的情况。

默认情况下,节点按误差从小到大的顺序排列。运行分析时,按图形按钮可以找到按标识号对节点进行排序的选项。

当分析使用检验数据集时,该图形中会包含分别单独对应于训练数据和检验数据的图。树在检验数据上的性能通常能够更好地表示树对新数据的执行效果。应仔细检查检验数据与训练数据之间的显著差异。

在下图中,终端节点 1 包含的残差最大。终端节点 13 具有一串负残差。如果仔细检查这些点,则可发现树与这些点以及节点中其他点未拟合的原因。终端节点 17 的 MSE 在终端节点中最小。与图另一侧的节点相比,终端节点 17 中的残差范围相对较小。