MARS® 回归中归因于最大残差的误差百分比统计量

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

使用误差百分比统计量可检查模型中拟合与最差拟合的误差量。当分析使用验证方法时,还可以比较用于训练和检验数据的模型的统计量。

表的每一行都显示给定残差百分比的误差统计量。来自最大残差的均方误 (MSE) 的百分比通常高于其他两个统计量的百分比。MSE 在计算中使用误差的平方,因此最极端的观测值通常对统计量的影响最大。MSE 的误差百分比与其他两个度量之间的较大差异可能表明模型对使用 R 平方准则或平均绝对偏差准则选择基函数更敏感。

使用验证技术时,结果包括训练数据和测试数据的单独统计信息。您可以比较这些统计量,检查模型在训练数据和新数据上的相对性能。检验统计量通常能够更好地衡量模型对新数据的执行效果。

一种可能的模式是,一小部分残差涉及很大一部分的数据误差。例如,在下表中,数据集的总大小约为 4400。从MSE的角度来看,这表明1%的数据约占误差的13%。在这种情况下,导致模型产生大部分误差的 31 个案例自然最能改进树。如果能找到一种方法来改善这些案例的拟合,则模型的整体性能会有相对较大的提高。

此条件还指示模型中案例误差不是最大的节点的置信度更高。由于大多数误差来自于少数案例,因此其他案例的拟合相对而言更准确。

归因于最大残差的误差百分比统计量


训练测试
最大残差百分比计数MSE 百分比MAD 百分比MAPE 百分比计数MSE 百分比MAD 百分比MAPE 百分比
1.03113.28244.99978.08851421.69896.90829.0517
2.06221.37648.937412.99102731.939611.637714.0987
2.57724.712510.696714.99893335.793513.610616.1761
3.09327.931512.481717.01284039.802215.783818.4925
4.012333.297915.637220.46715345.825919.412422.4744
5.015438.170718.693723.77856650.829122.719425.9526
7.523147.900125.495431.01049859.700029.626433.2548
10.030755.376431.421637.078713166.433935.733339.2610
15.046166.746241.816747.274019675.485345.670348.6658
20.061474.806650.542955.544326181.629253.860356.3489