使用 Mallows Cp 可以帮助您在多个回归模型中进行选择。它可帮助您在模型中的预测变量数方面实现重要平衡。Mallows Cp 会将全模型的精确度和偏倚与具有预测变量子集的模型进行比较。
通常,应当查找 Mallows Cp 较小且接近于模型中的预测变量加上常量所得数值的模型 (p)。较小的 Mallows Cp 值表明模型在估计实际回归系数和预测未来响应时相对比较精确(方差较小)。接近预测变量数加上常量数的 Mallows Cp 值表明模型在估计真实回归系数和预测未来响应时相对来说无偏倚。具有失拟和偏倚的模型的 Mallows Cp 值大于 p。
使用 Mallows Cp 比较回归模型竟在以同一组预测变量启动时有效。
如果任一预测变量与另一预测变量高度相关,则 Mallows Cp 不会显示在输出中。
例如,您效力于一家薯片公司,该公司正在检查影响每个包装内碎薯片百分比的因子。您在回归模型中将马铃薯相对于其他成分的百分比、冷却速度和加工温度作为预测变量。
步阶 | 马铃薯百分比 | 冷却速率 | 加工温度 | Mallows Cp |
---|---|---|---|---|
1 | X | 7.2 | ||
2 | X | X | 2.9 | |
3 | X | X | X | 5.5 |
结果表明包含两项因子(“马铃薯百分比”和“冷却速率”)的模型相对来说较精确且无偏倚,因为 Mallows Cp (2.9) 最接近预测变量加上常量数 (3)。您应当同时检验 Mallows Cp 与结果中包含的其他统计量,例如 R2、调整的 R2 和 S。