Le Cp de Mallows vous aide à choisir entre plusieurs modèles de régression. Il vous permet de trouver un juste équilibre concernant le nombre de prédicteurs figurant dans le modèle. Le Cp de Mallows compare la précision et le biais du modèle complet à ceux de modèles contenant un sous-ensemble des prédicteurs.
En général, vous devez rechercher les modèles où le Cp de Mallows est faible et proche du nombre de prédicteurs du modèle plus la constante (p). Un Cp de Mallows faible indique que le modèle est relativement précis (avec une variance faible) dans son estimation des coefficients de régression réels et sa prévision des réponses futures. Une valeur de Cp de Mallows proche du nombre de prédicteurs plus la constante indique que le modèle est relativement précis et non biaisé concernant l'estimation des véritables coefficients de régression et la prévision des futures réponses. La valeur du Cp de Mallows des modèles présentant une inadéquation de l'ajustement et un biais est supérieure à p.
Vous ne pouvez utiliser le Cp de Mallows pour comparer des modèles de régression que lorsque vous commencez avec le même ensemble de prédicteurs.
Si un prédicteur est fortement corrélé avec un autre prédicteur, le Cp de Mallows n'est pas affiché dans les résultats.
Par exemple, vous travaillez pour un fabricant de pommes chips qui étudie les facteurs jouant sur le pourcentage de chips brisées par conteneur. Vous incluez le pourcentage de pomme de terre par rapport aux autres ingrédients, la vitesse de refroidissement et la température de cuisson comme prédicteurs dans le modèle de régression.
Etape | % de pomme de terre | Vitesse de refroidissement | Température de cuisson | Cp de Mallows |
---|---|---|---|---|
1 | X | 7,2 | ||
2 | X | X | 2,9 | |
3 | X | X | X | 5,5 |
Les résultats indiquent que le modèle contenant à la fois les termes "% de pomme de terre" et "Vitesse de refroidissement" est relativement précis et non biaisé, car c'est celui dont le Cp de Mallows (2,9) est le plus proche de la somme du nombre de prédicteurs et de la constante (3). Vous devez étudier le Cp de Mallows avec d'autres statistiques figurant dans les résultats, comme R2, R2 ajusté et S.