MSE 或 MAD 与终端节点的散点图 - CART® 回归

使用 MSE 与终端节点的散点图或 MAD 与终端节点的散点图,可以查看拟合准确度最低和最高的节点。当分析使用检验数据集时,可以将训练数据图与检验数据图进行比较。

当节点分裂方式为最小平方误差时,y 轴显示均方误 (MSE)。当节点分裂方式为最小绝对偏差时,y 轴为平均绝对偏差 (MAD)。x 轴显示终端节点的标识号。默认情况下,节点按误差从小到大的顺序排列。运行分析时,按图形按钮可以找到按标识号对节点进行排序的选项。

解释

理想情况下,如果树与数据拟合良好,则所有节点的误差量均较小。常见模式适用于某些节点中的误差大于其他节点的情况。误差最小的节点的拟合置信度最高。误差最大的节点通过学习减少变异或查找解释节点变异的其他预测变量,可以表示改进树的最佳机会。

当分析使用检验数据集时,该图中会包含分别单独对应于训练数据和检验数据的图。树在检验数据上的性能通常能够更好地表示树对新数据的执行效果。应仔细检查检验数据与训练数据之间拟合准确度的显著差异。

在此图中,终端节点 8 的准确度比其他终端节点差。MSE 值越低的节点,其拟合准确性的置信度相对越高。如果存在减少或解释变异的方法,则终端节点 8 中的案例最有可能改进树。