¿Qué es Cp de Mallows?

Utilice el Cp de Mallows como ayuda para elegir entre múltiple modelos de regresión. Ayuda a alcanzar un equilibrio importante con el número de predictores en el modelo. El Cp de Mallows compara la precisión y el sesgo del modelo completo con modelos que incluyen un subconjunto de los predictores.

Generalmente, debe buscar modelos en los que el valor de Cp de Mallows sea pequeño y esté cercano al número de predictores en el modelo más la constante (p). Un valor de Cp pequeño indica que el modelo es relativamente preciso (tiene una varianza pequeña) para estimar los coeficientes de regresión verdaderos y pronosticar futuras respuestas. Un valor del Cp de Mallows que se aproxima al número de predictores más la constante indica que el modelo relativamente no tiene sesgo en la estimación de los verdaderos coeficientes de regresión y el pronóstico de respuestas futuras. Modelos con falta de ajuste y sesgo poseen valores de Cp de Mallows más grandes que p.

Important

El uso del Cp de Mallows para comparar modelos de regresión es válido solo cuando se empieza con el mismo conjunto completo de predictores.

Nota

Si cualquier predictor está altamente correlacionado con otro predictor, el Cp de Mallows no se muestra en la salida.

Ejemplo del uso de Cp de Mallows para evaluar un modelo

Por ejemplo, usted trabaja para una compañía de chips de patatas que examina los factores que afectan el número de chips desmenuzados por contenedor. Usted incluye el porcentaje de patatas en relación con otros ingredientes, la tasa de enfriamiento y la temperatura de cocción como predictores en el modelo de regresión.

Paso %Patata Tasa de enfriamiento Temp. de cocción Cp de Mallows
1 X     7,2
2 X X   2,9
3 X X X 5,5

Los resultados indican que el modelo con los dos términos "%Patata" y "Tasa de enfriamiento" es relativamente preciso y no tiene sesgo, porque su Cp de Mallows (2.9) se aproxima más al número de predictores más la constante (3). Usted debería examinar el Cp de Mallows junto con otras estadísticas incluidas en los resultados, como R2, R2 ajustado y S.