Validar suposições de modelo em regressão ou ANOVA

A regressão e a ANOVA não param quando o modelo é ajustado. Você deve examinar os gráficos residuais e outras estatísticas de diagnóstico para determinar se seu modelo é adequado e as suposições de regressão foram atendidas. Se seu modelo não for adequado, ele irá representar incorretamente seus dados. Por exemplo:
  • Os erros padrão dos coeficientes podem estar viciados, conduzindo a valores t e p incorretos.
  • Os coeficientes podem ter o sinal incorreto.
  • O modelo pode ser afetado por um ou dois pontos.
Use a tabela a seguir para determinar se seu modelo é adequado.
Características de um modelo de regressão adequado Verifique o uso Soluções possíveis
A forma funcional modela com exatidão qualquer curvatura que esteja presente.

Teste de falta de ajuste

Gráfico de resíduos vs variáveis

Adicionar termo de ordem mais alta ao modelo

Variáveis transformadas

Regressão não linear

Resíduos têm variância constante.

Gráfico de resíduos versus valores ajustados

Variáveis transformadas

Mínimos quadrados ponderados

Os resíduos são independentes (não correlacionados com) uns dos outros.

Estatística de Durbin-Watson

Gráfico de resíduos versus de ordem

Adicionar nova preditora

Usar análise de séries temporais

Adicionar variável de defasagem

Os resíduos são normalmente distribuídos.

Histograma de resíduos

Gráfico normal de resíduos

Gráfico de resíduos versus de ajuste

Teste de normalidade

Variáveis transformadas

Verificar quanto a outliers

Nenhuma observação atípica ou outliers.

Gráficos de resíduos

Leverages

Distância de Cook

DFITS

Variáveis transformadas

Remover observação de outlier

Os dados não estão mal condicionados.

Fator de inflação de variância (VIF)

Matriz de correlação de preditoras

Remover preditora

Regressão de mínimos quadrados parcial

Variáveis transformadas

Determinar por que um modelo não atende às suposições

Se você determinar que seu modelo não atende aos critérios anteriores, você deve:
  1. Determine se seus dados foram inseridos corretamente, especialmente as observações identificadas como atípicas.
  2. Tente determinar a causa do problema. Você pode querer determinar quão sensível à questão é o seu modelo. Por exemplo, se você tem um outlier, faça a análise de regressão sem aquela observação e determine como os resultados diferem.
  3. Considere usar uma das soluções possíveis listadas anteriormente.