什么是Mallows 的 Cp

使用 Mallows Cp 可以帮助您在多个回归模型中进行选择。它可帮助您在模型中的预测变量数方面实现重要平衡。Mallows Cp 会将全模型的精确度和偏倚与具有预测变量子集的模型进行比较。

通常,应当查找 Mallows Cp 较小且接近于模型中的预测变量加上常量所得数值的模型 (p)。较小的 Mallows Cp 值表明模型在估计实际回归系数和预测未来响应时相对比较精确(方差较小)。接近预测变量数加上常量数的 Mallows Cp 值表明模型在估计真实回归系数和预测未来响应时相对来说无偏倚。具有失拟和偏倚的模型的 Mallows Cp 值大于 p。

重要信息

使用 Mallows Cp 比较回归模型竟在以同一组预测变量启动时有效。

注意

如果任一预测变量与另一预测变量高度相关,则 Mallows Cp 不会显示在输出中。

使用Mallows 的 Cp评估模型的示例

例如,您效力于一家薯片公司,该公司正在检查影响每个包装内碎薯片百分比的因子。您在回归模型中将马铃薯相对于其他成分的百分比、冷却速度和加工温度作为预测变量。

步阶 马铃薯百分比 冷却速率 加工温度 Mallows Cp
1 X     7.2
2 X X   2.9
3 X X X 5.5

结果表明包含两项因子(“马铃薯百分比”和“冷却速率”)的模型相对来说较精确且无偏倚,因为 Mallows Cp (2.9) 最接近预测变量加上常量数 (3)。您应当同时检验 Mallows Cp 与结果中包含的其他统计量,例如 R2、调整的 R2 和 S。