Interpretar os principais resultados para Ajustar modelo de Poisson

Conclua as etapas a seguir para interpretar um modelo de regressão de Poisson. A saída principal inclui o valor-p, os coeficientes, as estatísticas de resumo do modelo e os gráficos de resíduos.

Etapa 1: Determinar se a associação entre a resposta e o termo é estatisticamente significativa

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que não há nenhuma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Se um termo do modelo for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
  • Se um preditor contínuo for significativo, é possível concluir que o coeficiente para o preditor é diferente de zero.
  • Se um preditor categórico é significativo, é possível concluir que nem todos os níveis do fator tem o mesmo número de eventos médios.
  • Se um termo de interação for significativo, é possível concluir que a relação entre um preditor e o número de eventos depende dos outros preditores no termo.
  • Se um termo polinomial for significativo, é possível concluir que a relação entre um preditor e o número de eventos depende da magnitude do preditor.
Tabela Deviance Fonte GL Desv (Aj.) Média (Aj.) Qui-Quadrado Valor-P Regressão 3 56,670 18,8900 56,67 0,000 Horas Desde a Limpeza 1 4,744 4,7444 4,74 0,029 Temperatura 1 38,800 38,8000 38,80 0,000 Tamanho do Parafuso 1 13,126 13,1256 13,13 0,000 Erro 32 31,607 0,9877 Total 35 88,277
Coeficientes Termo Coef EP de Coef VIF Constante 4,3982 0,0628 Horas Desde a Limpeza 0,01798 0,00826 1,00 Temperatura -0,001974 0,000318 1,00 Tamanho do Parafuso pequeno -0,1546 0,0427 1,00
Principais resultados: Valor-p, Coeficientes

Nesses resultados, todas as três preditoras são estatisticamente significativas no nível 0,05. Você pode concluir que as mudanças nessas variáveis estão associadas com mudanças na variável de resposta.

Use o coeficiente para determinar se uma alteração em uma variável preditora torna o evento mais ou menos provável. O coeficiente estimado para um preditor representa a mudança na função de link de cada mudança na unidade no preditor, enquanto os outros preditores do modelo são mantidos constantes. A relação entre o coeficiente e o número de eventos depende de vários aspectos da análise, incluindo a função de link e os níveis de referência para preditores categóricos que estão no modelo. Em geral, os coeficientes positivos tornam o evento mais provável e os coeficientes negativos tornam o evento menos provável. Um coeficiente estimado próximo de zero indica que o efeito do preditor é pequena ou inexistente.

A interpretação dos coeficientes estimados para preditores categóricos é relativa ao nível de referência do preditor. Os coeficientes positivos indicam que o evento é mais provável nesse nível do preditor do que no nível de referência do fator. Os coeficientes negativos indicam que o evento é menos provável nesse nível do preditor do que no nível de referência.

O coeficiente de Horas Desde a Limpeza é positivo, o que sugere que horas mais longas estão associadas a valores mais altos da resposta. O coeficiente de temperatura é negativo, o que sugere que temperaturas mais altas estão associadas a valores menores de resposta.

O tamanho do parafuso é uma variável categórica com um coeficiente, o que indica que a variável tem 2 níveis e a variável usa a codificação 0, 1. O coeficiente do parafuso menor é negativo, portanto, o parafuso pequeno está associado a valores menores de resposta do que o nível de referência.

Se um termo de interação for estatisticamente significativo, a relação entre uma preditora e a resposta difere pelo nível da outra preditora. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação. Para obter uma compreensão melhor dos efeitos principais, dos efeitos da interação e da curvatura em seu modelo, vá para Gráficos Fatoriais e Otimização de Resposta.

Etapa 2: Determine se o modelo não se ajusta aos seus dados

Use os testes de qualidade do ajuste para determinar se os números de eventos preditos se desviam dos números de eventos observados de uma maneira que a distribuição de Poisson não prediz. Se o valor-p do teste de qualidade do ajuste for inferior ao seu nível de significância escolhido, você pode rejeitar a hipótese nula de que a distribuição de Poisson fornece um bom ajuste. Esta lista fornece motivos comuns para desvios:
  • Função de ligação incorreta
  • Termo de ordem mais alta omitido para variáveis no modelo
  • Preditora omitida que não está no modelo
  • Superdispersão

Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.

Testes de Qualidade de Ajuste Teste GL Estimativa Média Qui-Quadrado Valor-P Deviance 32 31,60722 0,98773 31,61 0,486 Pearson 32 31,26713 0,97710 31,27 0,503
Principais resultados: teste Deviance, teste de Pearson

Nesses resultados, os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Não há evidências suficientes para concluir que os números de eventos preditos se desviam dos números de eventos observados.

Etapa 3: Determine quão bem o modelo se ajusta aos seus dados

Use o AIC para comparar modelos diferentes. Quanto menor o AIC, melhor o modelo se ajusta aos dados. No entanto, o modelo com o menor AIC para um conjunto de preditores não necessariamente ajusta bem os dados. Use também os testes de qualidade do ajuste e os gráficos de resíduos para avaliar se um modelo ajusta bem os dados.

Sumário do Modelo R-quad R2 (Aj.) Deviance Deviance AIC 64,20% 60,80% 253,29
Coeficientes Termo Coef EP de Coef VIF Constante 4,3982 0,0628 Horas Desde a Limpeza 0,01798 0,00826 1,00 Temperatura -0,001974 0,000318 1,00 Tamanho do Parafuso pequeno -0,1546 0,0427 1,00
Principais resultados: AIC

No primeiro conjunto de resultados, o AIC é aproximadamente 253. Este modelo não inclui a interação entre temperatura e tamanho do parafuso. O modelo AIC individual não indica se o modelo é bom ou ruim, porque o valor depende do tamanho da amostra.

Sumário do Modelo R-quad R2 (Aj.) Deviance Deviance AIC 85,99% 81,46% 236,05
Coeficientes Termo Coef EP de Coef VIF Constante 4,5760 0,0736 Horas Desde a Limpeza 0,01798 0,00826 1,00 Temperatura -0,003285 0,000441 1,92 Tamanho do Parafuso pequeno -0,5444 0,0990 5,37 Temperatura*Tamanho do Parafuso pequeno 0,002804 0,000640 6,64

No segundo conjunto de resultados, o AIC é aproximadamente 236. Este modelo inclui a interação entre temperatura e o tamanho do parafuso. O AIC menor indica que o modelo com a interação tem melhor desempenho.

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política