O que é Cp de Mallows?

Use Cp de Mallows para ajudar a escolher entre modelos de regressão. Ele ajuda a obter um equilíbrio importante com o número de preditores no modelo. O Cp de Mallows compara a precisão e o vício do modelo completo a modelos com um subconjunto de preditores.

Normalmente, você deve procurar modelos em que o Cp de Mallows é pequeno e próximo do número de preditores no modelo mais a constante (p). Um pequeno valor de Cp de Mallows indica que o modelo é relativamente preciso (tem pequena variação) na estimativa dos verdadeiros coeficientes de regressão e na previsão de respostas futuras. Um valor de Cp de Mallows que está próximo do número de preditores mais a constante indica que o modelo é relativamente imparcial na estimativa dos coeficientes de regressão verdadeiros e na previsão de respostas futuras. Modelos com falta de ajuste e vício possuem valores de Cp de Mallows maiores que p.

Importante

Usar o Cp de Mallows para comparar modelos de regressão só é válido quando você começa com o mesmo conjunto completo de preditoras.

Observação

Se alguma preditora for altamente correlacionado com outro preditora, o Cp de Mallows não será exibido na saída.

Exemplo de uso do Cp de Mallows para avaliar um modelo

Por exemplo, você trabalha para um fabricante de batatas fritas que examina os fatores que afetam a porcentagem de batatas quebradas por embalagem. Você inclui a porcentagem de batatas em relação a outros ingredientes, taxa de resfriamento e temperatura de cozimento como preditores no modelo de regressão.

Etapa %Batata Taxa de resfriamento Temp de cozimento Cp de Mallows
1 X     7,2
2 X X   2,9
3 X X X 5,5

Os resultados indicam que o modelo com os dois termos "%Batatas" e "Taxa de resfriamento" é relativamente exato e não viciado porque sua Cp Mallows (2,9) está mais próximo do número de preditores mais a constante (3). Você deve examinar a Cp Mallows em conjunto com outras estatísticas incluídas nos resultados, como R2, R2 Ajustado, e S.