Interpretar os principais resultados para Ajustar modelo de Poisson

Conclua as etapas a seguir para interpretar um modelo de regressão de Poisson. A saída principal inclui o valor-p, os coeficientes, as estatísticas de resumo do modelo e os gráficos de resíduos.

Etapa 1: Determinar se a associação entre a resposta e o termo é estatisticamente significativa

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que não há nenhuma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Se um termo do modelo for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
  • Se uma preditora contínua for significativo, é possível concluir que o coeficiente para a preditora é diferente de zero.
  • Se um preditor categórico é significativo, é possível concluir que nem todos os níveis do fator tem o mesmo número de eventos médios.
  • Se um termo de interação for significativo, é possível concluir que a relação entre um preditor e o número de eventos depende dos outros preditores no termo.
  • Se um termo polinomial for significativo, é possível concluir que a relação entre um preditor e o número de eventos depende da magnitude do preditor.

Análise de Variância



Teste de Wald
FonteGLQui-QuadradoValor-p
Regressão356,290,000
  Horas Desde a Limpeza14,740,029
  Temperatura138,460,000
  Tamanho do Parafuso113,090,000

Coeficientes

TermoCoefEP de CoefValor-ZValor-PVIF
Constante4,39820,062870,020,000 
Horas Desde a Limpeza0,017980,008262,180,0291,00
Temperatura-0,0019740,000318-6,200,0001,00
Tamanho do Parafuso         
  pequeno-0,15460,0427-3,620,0001,00
Principais resultados: Valor-p, Coeficientes

Nesses resultados, todas as três preditoras são estatisticamente significativas no nível 0,05. É possível concluir que as mudanças nessas variáveis estão associadas às alterações nas variáveis resposta.

Use o coeficiente para determinar se uma mudança na variável preditora pode tornar o evento mais ou menos provável. O coeficiente estimado para uma preditora representa a mudança na função de ligação para cada mudança de unidade na preditora, enquanto as outras preditoras no modelo são consideradas constantes. A relação entre o coeficiente e o número de eventos depende de vários aspectos da análise, incluindo a função de link e os níveis de referência para preditores categóricos que estão no modelo. Geralmente, os coeficientes positivos tornam o evento mais provável e os coeficientes negativos tornam o evento menos provável. Um coeficiente estimado próximo de zero indica que o efeito do preditor é pequena ou inexistente.

A interpretação dos coeficientes estimados para preditoras categóricas depende do nível de referência da preditora. Coeficientes positivos indicam que o primeiro evento é mais provável no nível da preditora do que no nível de referência do fator. Os coeficientes negativos indicam que o evento é mais provável no nível da preditora do que no nível de referência.

O coeficiente de Horas Desde a Limpeza é positivo, o que sugere que horas mais longas estão associadas a valores mais altos da resposta. O coeficiente de temperatura é negativo, o que sugere que temperaturas mais altas estão associadas a valores menores de resposta.

O tamanho do parafuso é uma variável categórica com um coeficiente, o que indica que a variável possui 2 níveis e a variável usa 0,1 codificação. O coeficiente para o pequeno parafuso é negativo, então o pequeno parafuso é associado com valores menores da resposta do que o nível de referência.

Se um termo de interação for estatisticamente significativo, a relação entre uma preditora e a resposta difere pelo nível da outra preditora. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação. Para obter uma compreensão melhor dos efeitos principais, dos efeitos da interação e da curvatura em seu modelo, vá para Gráficos Fatoriais e Otimização de Resposta.

Etapa 2: Determine se o modelo não se ajusta aos seus dados

Use os testes de qualidade do ajuste para determinar se os números de eventos preditos se desviam dos números de eventos observados de uma maneira que a distribuição de Poisson não prediz. Se o valor-p do teste de qualidade do ajuste for inferior ao seu nível de significância escolhido, você pode rejeitar a hipótese nula de que a distribuição de Poisson fornece um bom ajuste. Esta lista fornece motivos comuns para desvios:
  • Função de ligação incorreta
  • Termo de ordem mais alta omitido para variáveis no modelo
  • Preditora omitida que não está no modelo
  • Superdispersão

Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.

Testes de Qualidade de Ajuste

TesteGLEstimativaMédiaQui-QuadradoValor-P
Deviance3231,607220,9877331,610,486
Pearson3231,267130,9771031,270,503
Principais resultados: teste Deviance, teste de Pearson

Nesses resultados, os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Não há evidências suficientes para concluir que os números de eventos preditos se desviam dos números de eventos observados.

Etapa 3: Determinar quão bem o modelo se ajusta aos seus dados

Use o AIC, AICc e BIC para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis. No entanto, o modelo com o menor valor para um conjunto de preditores não necessariamente ajusta bem os dados. Use também os testes de qualidade do ajuste e os gráficos de resíduos para avaliar se um modelo ajusta bem os dados.

Sumário do Modelo

R2 DevianceR2 (Aj.)
Deviance
AICAICcBIC
64,20%60,80%253,29254,58259,62

Coeficientes

TermoCoefEP de CoefValor-ZValor-PVIF
Constante4,39820,062870,020,000 
Horas Desde a Limpeza0,017980,008262,180,0291,00
Temperatura-0,0019740,000318-6,200,0001,00
Tamanho do Parafuso         
  pequeno-0,15460,0427-3,620,0001,00
Principais resultados: AIC

No primeiro conjunto de resultados, o AIC é aproximadamente 253. O AICc é aproximadamente 255. O BIC é aproximadamente 260. Este modelo não inclui a interação entre a temperatura e o tamanho do parafuso. Os critérios de informação de um modelo individual não indicam se o modelo se ajusta bem ou não aos dados porque os valores dependem do tamanho da amostra.

Sumário do Modelo

R2 DevianceR2 (Aj.)
Deviance
AICAICcBIC
85,99%81,46%236,05238,05243,97

Coeficientes

TermoCoefEP de CoefValor-ZValor-PVIF
Constante4,57600,073662,150,000 
Horas Desde a Limpeza0,017980,008262,180,0291,00
Temperatura-0,0032850,000441-7,460,0001,92
Tamanho do Parafuso         
  pequeno-0,54440,0990-5,500,0005,37
Temperatura*Tamanho do Parafuso         
  pequeno0,0028040,0006404,380,0006,64

No segundo conjunto de resultados, o AIC é aproximadamente 236. O AICc é aproximadamente 238. O BIC é aproximadamente 244. Este modelo inclui a interação entre a temperatura e o tamanho do parafuso. Os valores menores indicam que o modelo com a interação apresenta melhor desempenho.