Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária

Neste tópico

O efeito do formato de dados sobre a interpretação do R² da desviância e o R² ajustado da desviância
Porque o teste de qualidade de ajuste da desviância pode ser equivocado para os dados de resposta/frequência binária
Porque o teste de qualidade de ajuste de Pearson pode ser equivocado para os dados de resposta/frequência binária

Na regressão logística binária, você pode inserir dados em dois formatos diferentes: formato de Resposta binária/Frequência binária e formato de Evento/Ensaio. A confiabilidade e interpretação de algumas estatísticas na saída dependem do formato dos dados. Para obter mais informações sobre quando usar cada formato de dados, acesse Quando usar cada formato de dados na regressão logística binária.

O efeito do formato de dados sobre a interpretação do R² da desviância e o R² ajustado da desviância

Para a regressão logística binária, o formato dos dados afeta o modo como você interpreta os valores do R² da desviância e do R² da desviância ajustada. No formato de Evento/Ensaio, cada valor observado representa a probabilidade do evento para todos os ensaios naquela linha dos dados. Normalmente, essa probabilidade é para muitos ensaios e está entre 0 e 1. Por outro lado, cada observação no formato de Resposta/Frequência Binária geralmente representa apenas 1 ensaio. O valor observado para um único ensaio é 1 ou 0.

Em geral, a diferença entre os formatos de dados torna a desviância total nos dados diferente. Para dados de Eventos/Ensaio, a desviância se refere à discrepância entre as probabilidades previstas e as probabilidades observadas. Para o formato de Resposta/Frequência Binária, a desviância se refere à discrepância entre as probabilidades previstas e o resultado de 0% ou 100% para cada ensaio. O R² da desviância e o R² da desviância ajustada são normalmente mais altos para os dados em formato de Evento/Ensaio.

Uma ilustração gráfica esclarece a diferença. Nesses gráficos, os símbolos representam as observações nos dados e a curva representa os valores preditos no modelo. Para os dados de Evento/Ensaio, os símbolos caem próximos à linha. O valor de R² da desviância para os dados de Evento/Ensaio é de aproximadamente 96%. O modelo prediz as probabilidades médias muito bem.

Para os dados de Resposta/Frequência Binária, as observações são perto da linha predita apenas quando a linha está perto de 0% ou 100%. O valor de R² da desviância para os dados de Resposta/Frequência Binária é de aproximadamente 56%. A relação entre as probabilidades preditas e os casos individuais não são tão fortes.

Porque o teste de qualidade de ajuste da desviância pode ser equivocado para os dados de resposta/frequência binária

Para a regressão logística binária, o formato dos dados afeta se os testes de qualidade do ajuste da desviância forem confiáveis. O valor-p para o teste de qualidade de ajuste da desviância geralmente diminui à medida que o número de ensaios por linha diminui. Os dados no formato de Resposta/Frequência Binária geralmente têm poucos ensaios por linha. Assim, o teste de qualidade de ajuste da desviância é tende a indicar um ajuste insuficiente quando os dados estão no formato de Resposta/Frequência Binária mesmo quando o ajuste é bom. O teste de qualidade de ajuste da desviância também tende a indicar falsamente um ajuste insuficiente quando os dados estão no formato de Evento/Ensaio mas o número de ensaios por linha é pequeno.

O teste de Hosmer-Lemeshow não depende do formato dos dados. Quando os dados têm poucos ensaios por linha, o teste de Hosmer-Lemeshow é um indicador mais confiável de o quão bem o modelo ajusta os dados.

Compare estes dois conjuntos de resultados para os mesmos dados em diferentes formatos. Para estes dados, a forma do modelo é correta. A informação de resposta, coeficientes e os resultados do teste de Hosmer- Lemeshow são os mesmos. A conclusão para o teste de qualidade do ajuste da desviância depende do formato dos dados.

Nestes resultados, os dados estão no formato de Resposta/Frequência Binário com nenhuma coluna de frequência. A análise utiliza 500 linhas de dados. Cada linha representa um ensaios. No nível 0,05 de significância, o valor-p para o teste de qualidade de ajuste da desviância indica que o modelo se ajusta de maneira insatisfatória. Este valor-p conduz à conclusão incorreta de que o formato do modelo está incorreto. Se você coletar os dados no formato de Resposta/Frequência Binária, o teste de qualidade de ajuste da desviância muitas vezes não é confiável.

Regressão Logística Binária: Y versus X

Método Função de Ligação Logito Linhas usadas 500

Informações da Resposta Variável Valor Contagem Y Evento 160 (Evento) Não evento 340 Total 500

Coeficientes Termo Coef EP de Coef VIF Constante -2,107 0,282 X 0,0904 0,0121 11,97 X*X -0,000889 0,000115 11,97

Testes de Qualidade de Ajuste Teste GL Qui-Quadrado Valor-P Deviance 497 552,03 0,044 Pearson 497 504,42 0,399 Hosmer-Lemeshow 3 3,76 0,288

Nestes resultados, os dados estão no formato Evento/Ensaio. A análise usa 5 linhas de dados. Cada linha de dados representa a 100 ensaios. No nível 0,05 de significância, o valor-p para o teste de qualidade de ajuste da desviância não encontra evidências de um modelo mal-ajustado. Se você coletar dados em formato Evento/Ensaio, o teste de qualidade de ajuste da desviância normalmente é confiável.

Regressão Logística Binária: Evento versus X

Método Função de Ligação Logito Linhas usadas 5

Informações da Resposta Nome do Variável Valor Contagem Evento Evento Evento 160 Evento Não-evento 340 Avaliação Total 500

Coeficientes Termo Coef EP de Coef VIF Constante -2,107 0,282 X 0,0904 0,0121 11,97 X*X -0,000889 0,000115 11,97

Testes de Qualidade de Ajuste Teste GL Qui-Quadrado Valor-P Deviance 2 3,78 0,151 Pearson 2 3,76 0,152 Hosmer-Lemeshow 3 3,76 0,288

Porque o teste de qualidade de ajuste de Pearson pode ser equivocado para os dados de resposta/frequência binária

Para a regressão logística binária, o formato dos dados afeta se os testes de qualidade do ajuste de Pearson forem confiáveis. A aproximação para a distribuição do qui-quadrado que o teste de Pearson usa é imprecisa quando o número esperado de eventos por linha é baixo. Os dados no formato de Resposta/Frequência Binária geralmente têm poucos ensaios por linha. Assim, o teste de qualidade de ajuste de Pearson tende a ser impreciso quando os dados estão no formato de Resposta/Frequência binária.

Compare estes dois conjuntos de resultados para os mesmos dados em diferentes formatos. Para estes dados, a forma do modelo está incorreta. O modelo verdadeiro contém a interação entre X1 e X2. A informação de resposta, coeficientes e os resultados do teste de Hosmer- Lemeshow são os mesmos. A conclusão para o teste de qualidade do ajuste de Pearson depende do formato dos dados.

Nestes resultados, os dados estão no formato de Resposta/Frequência Binário com uma coluna de frequência. A análise usa 18 linhas de dados. Cada linha representa 250 ensaios de Bernoulli. No nível 0,05 de significância, o valor-p para o teste de qualidade de ajuste de Pearson indica que o modelo ajusta os dados. Este valor-p conduz à conclusão incorreta de que o modelo é adequado. Se você coletar os dados no formato de Resposta/Frequência Binária, o teste de qualidade de ajuste de Pearson não é confiável.

Regressão Logística Binária: Y versus X1; X2

Método Função de Ligação Logito Frequência Frequência Linhas usadas 18

Informações da Resposta Variável Valor Contagem Y Sim 2645 (Evento) Não 1855 Total 4500

Coeficientes Termo Coef EP de Coef VIF Constante -0,612 0,110 X1 0,1585 0,0375 1,00 X2 0,3290 0,0377 1,00

Testes de Qualidade de Ajuste Teste GL Qui-Quadrado Valor-P Deviance 4497 6004,05 0,000 Pearson 4497 4504,84 0,464 Hosmer-Lemeshow 7 66,06 0,000

Nestes resultados, os dados estão no formato Evento/Ensaio. A análise usa 9 linhas de dados. Cada linha de dados representa a 500 ensaios. No nível 0,05 de significância, o valor-p para o teste de qualidade de ajuste de Pearson indica que o modelo não ajusta os dados. Se você coletar dados em formato Evento/Ensaio, o teste de qualidade de ajuste de Pearson normalmente é confiável.

Regressão Logística Binária: Y versus X1; X2

Método Função de Ligação Logito Linhas usadas 9

Informações da Resposta Nome do Variável Valor Contagem Evento Y Evento 2645 Sim Não-evento 1855 Ensaios Total 4500

Coeficientes Termo Coef EP de Coef VIF Constante -0,612 0,110 X1 0,1585 0,0375 1,00 X2 0,3290 0,0377 1,00

Testes de Qualidade de Ajuste Teste GL Qui-Quadrado Valor-P Deviance 6 67,48 0,000 Pearson 6 66,06 0,000 Hosmer-Lemeshow 7 66,06 0,000

Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária

Neste tópico

O efeito do formato de dados sobre a interpretação do R2 da desviância e o R2 ajustado da desviância

Porque o teste de qualidade de ajuste da desviância pode ser equivocado para os dados de resposta/frequência binária

Regressão Logística Binária: Y versus X

Regressão Logística Binária: Evento versus X

Porque o teste de qualidade de ajuste de Pearson pode ser equivocado para os dados de resposta/frequência binária

Regressão Logística Binária: Y versus X1; X2

Regressão Logística Binária: Y versus X1; X2

O efeito do formato de dados sobre a interpretação do R² da desviância e o R² ajustado da desviância