箱线图显示实际值和拟合值之间的差异。距离最近的四分位数超过 1.5 倍四分位间距的点具有单值符号。
解释
理想情况下,残差全部接近于 0(相对于响应变量的尺度而言)。当分析使用验证方法时,训练数据和验证结果的图表会分别显示。验证结果中树的性能通常更能反映树在新数据中的表现。你应该调查验证结果和训练数据之间的巨大差异。
这些箱线图显示,检验数据集比训练数据集的四分位间距大得多。这种差异表明模型在新数据上的性能不如模型在训练数据上的性能。此外,由单值符号表示的大残差还可以指示模型并非能与所有数据良好拟合。