Testes de Qualidade do Ajuste para Ajustar modelo logístico binário

Encontre definições e orientações de interpretação para cada estatística na tabela de teste Qualidade do ajuste.

Teste de Qualidade do Ajuste Deviance

O teste de qualidade de ajuste de deviance avalia a discrepância entre o modelo atual e o modelo completo.

Interpretação

Use os testes de qualidade do ajuste para determinar se as probabilidades preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Se o valor-p do teste de qualidade do ajuste for menor do que seu nível de significância escolhido, as probabilidade preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Esta lista fornece motivos comuns para o desvio:
  • Função de ligação incorreta
  • Termo de ordem mais alta omitido para variáveis no modelo
  • Preditora omitida que não está no modelo
  • Superdispersão

Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.

Para a regressão logística binária, o formato dos dados afeta o valor de p, pois altera o número de ensaios por linha. O valor de p para o teste de deviance geralmente diminui à medida que o número de ensaios por linha diminui. O teste de Hosmer-Lemeshow não depende do formato dos dados. Quando os dados têm poucos ensaios por linha, o teste de Hosmer-Lemeshow é um indicador mais confiável de o quão bem o modelo ajusta os dados. Para obter mais informações, vá para Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.

Teste de Qualidade do Ajuste de Pearson

O teste de qualidade de ajuste de Pearson avalia a discrepância entre o modelo atual e o modelo completo.

Interpretação

Use os testes de qualidade do ajuste para determinar se as probabilidades preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Se o valor-p do teste de qualidade do ajuste for menor do que seu nível de significância escolhido, as probabilidade preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Esta lista fornece motivos comuns para o desvio:
  • Função de ligação incorreta
  • Termo de ordem mais alta omitido para variáveis no modelo
  • Preditora omitida que não está no modelo
  • Superdispersão

Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.

Para a regressão logística binária, o formato dos dados afeta o valor de p, pois altera o número de ensaios por linha. A aproximação para a distribuição do qui-quadrado que o teste de Pearson usa é imprecisa quando o número esperado de eventos por linha nos dados é baixo. Assim, o teste de qualidade de ajuste de Pearson é impreciso quando os dados estão no formato de Resposta/Frequência binária. O teste de Hosmer-Lemeshow não depende do formato dos dados. Quando os dados têm poucos ensaios por linha, o teste de Hosmer-Lemeshow é um indicador mais confiável de o quão bem o modelo ajusta os dados. Para obter mais informações, vá para Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.

Hosmer-Lemeshow

O teste de qualidade de ajuste de Hosmer-Lemeshow compara as frequências observadas e esperadas de eventos e não eventos para avaliar se o modelo ajusta bem os dados.

Interpretação

Use os testes de qualidade do ajuste para determinar se as probabilidades preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Se o valor-p do teste de qualidade do ajuste for menor do que seu nível de significância escolhido, as probabilidade preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Esta lista fornece motivos comuns para o desvio:
  • Função de ligação incorreta
  • Termo de ordem mais alta omitido para variáveis no modelo
  • Preditora omitida que não está no modelo
  • Superdispersão

Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.

O teste de Hosmer-Lemeshow não depende do número de ensaios por linha nos dados como os outros testes de qualidade do ajuste. Quando os dados têm poucos ensaios por linha, o teste de Hosmer-Lemeshow é um indicador mais confiável de o quão bem o modelo ajusta os dados.

Frequências observadas e esperadas para teste de Hosmer-Lemeshow

O modelo prediz as frequências esperadas para o teste de Hosmer-Lemeshow.

Interpretação

Use as frequências observadas e esperadas para o teste de Hosmer-Lemeshow para descrever quão bem o modelo se ajusta aos dados ou para procurar áreas de ajuste ruim.

Por exemplo, o modelo com o termo X produz testes de qualidade de ajuste com pequenos valores-p, que indicam que o modelo está mal ajustado aos dados. Na tabela das frequências observadas e esperadas, os valores esperados foram diferentes em mais de 10 eventos para todos os grupos exceto para o grupo 4, quando a probabilidade do evento está entre 0,32 e 0,325.

Quando o modelo inclui X e X*X, os testes de qualidade do ajuste têm valores-p grandes. Os dados não fornecem eveidências de que as probabilidades estimadas desviam das probabilidade observadas de uma forma que a distribuição binomial não prediz. A maior diferença entre o número observado e o esperado de eventos está no grupo 4. Esta diferença é de aproximadamente 7.

Regressão Logística Binária: Evento versus X

Coeficientes Termo Coef EP de Coef VIF Constante -0,800 0,167 X 0,00092 0,00271 1,00
Testes de Qualidade de Ajuste Teste GL Qui-Quadrado Valor-P Deviance 3 78,50 0,000 Pearson 3 74,96 0,000 Hosmer-Lemeshow 3 74,96 0,000
Frequências Observadas e Esperadas para o Teste de Hosmer-Lemeshow Amplitude da Probabilidade Evento Não-evento Grupo do Evento Observado Esperado Observado Esperado 1 (0,000; 0,310) 10 31,0 90 69,0 2 (0,310; 0,315) 40 31,5 60 68,5 3 (0,315; 0,320) 60 32,0 40 68,0 4 (0,320; 0,325) 35 32,5 65 67,5 5 (0,325; 0,330) 15 33,0 85 67,0

Regressão Logística Binária: Evento versus X

Informações da Resposta Nome do Variável Valor Contagem Evento Evento Evento 160 Evento Não-evento 340 Ensaio Total 500
Coeficientes Termo Coef EP de Coef VIF Constante -2,107 0,282 X 0,0904 0,0121 11,97 X*X -0,000889 0,000115 11,97
Testes de Qualidade de Ajuste Teste GL Qui-Quadrado Valor-P Deviance 2 3,78 0,151 Pearson 2 3,76 0,152 Hosmer-Lemeshow 3 3,76 0,288
Frequências Observadas e Esperadas para o Teste de Hosmer-Lemeshow Amplitude da Probabilidade Evento Não-evento Grupo do Evento Observado Esperado Observado Esperado 1 (0,000; 0,108) 10 10,8 90 89,2 2 (0,108; 0,124) 15 12,4 85 87,6 3 (0,124; 0,401) 40 40,1 60 59,9 4 (0,401; 0,419) 35 41,9 65 58,1 5 (0,419; 0,548) 60 54,8 40 45,2
Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política