Use Cp de Mallows para ajudar a escolher entre modelos de regressão. Ele ajuda a obter um equilíbrio importante com o número de preditores no modelo. O Cp de Mallows compara a precisão e o vício do modelo completo a modelos com um subconjunto de preditores.
Normalmente, você deve procurar modelos em que o Cp de Mallows é pequeno e próximo do número de preditores no modelo mais a constante (p). Um pequeno valor de Cp de Mallows indica que o modelo é relativamente preciso (tem pequena variação) na estimativa dos verdadeiros coeficientes de regressão e na previsão de respostas futuras. Um valor de Cp de Mallows que está próximo do número de preditores mais a constante indica que o modelo é relativamente imparcial na estimativa dos coeficientes de regressão verdadeiros e na previsão de respostas futuras. Modelos com falta de ajuste e vício possuem valores de Cp de Mallows maiores que p.
Usar o Cp de Mallows para comparar modelos de regressão só é válido quando você começa com o mesmo conjunto completo de preditoras.
Se alguma preditora for altamente correlacionado com outro preditora, o Cp de Mallows não será exibido na saída.
Por exemplo, você trabalha para um fabricante de batatas fritas que examina os fatores que afetam a porcentagem de batatas quebradas por embalagem. Você inclui a porcentagem de batatas em relação a outros ingredientes, taxa de resfriamento e temperatura de cozimento como preditores no modelo de regressão.
Etapa | %Batata | Taxa de resfriamento | Temp de cozimento | Cp de Mallows |
---|---|---|---|---|
1 | X | 7,2 | ||
2 | X | X | 2,9 | |
3 | X | X | X | 5,5 |
Os resultados indicam que o modelo com os dois termos "%Batatas" e "Taxa de resfriamento" é relativamente exato e não viciado porque sua Cp Mallows (2,9) está mais próximo do número de preditores mais a constante (3). Você deve examinar a Cp Mallows em conjunto com outras estatísticas incluídas nos resultados, como R2, R2 Ajustado, e S.