Teste de Wald | |||
---|---|---|---|
Fonte | GL | Qui-Quadrado | Valor-p |
Regressão | 1 | 7,83 | 0,005 |
Dose (mg) | 1 | 7,83 | 0,005 |
Termo | Coef | EP de Coef | Valor-Z | Valor-P | VIF |
---|---|---|---|---|---|
Constante | -5,25 | 1,99 | -2,64 | 0,008 | |
Dose (mg) | 3,63 | 1,30 | 2,80 | 0,005 | 1,00 |
Nesses resultados, a dosagem é estatisticamente significativa no nível de significância de 0,05. Você pode concluir que as mudanças na dosagem estão associadas com mudanças nas probabilidades de que os eventos ocorram.
Avalie o coeficiente para determinar se uma mudança na variável preditora pode tornar o evento mais ou menos provável. A relação entre o coeficiente e as probabilidades dependem de diversos aspectos da análise, incluindo a função de ligação. Geralmente, os coeficientes positivos indicam que o evento se torna mais provável conforme a preditora aumenta. Coeficientes negativos indicam que o evento torna-se menos provável conforme a preditora aumenta. Para obter mais informações, acesse Coeficientes e equação de regressão para Ajustar modelo logístico binário.
O coeficiente para a dose é 3,63, o que sugere que doses maiores estão associadas a valores mais altos de que o evento ocorrerá.
Se um termo de interação for estatisticamente significativo, a relação entre uma preditora e a resposta difere pelo nível da outra preditora. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação. Para obter uma compreensão melhor dos efeitos principais, dos efeitos da interação e da curvatura em seu modelo, vá para Gráficos Fatoriais e Otimização de Resposta.
As razões de chances que são maiores do que 1 indicam que o evento tem mais probabilidade de ocorrer conforme a preditora aumenta. As razões de chances que não menos do que 1 indicam que o evento tem menos probabilidade de ocorrer conforme a preditora aumenta.
Unidade de Mudança | Razão de Chances | IC de 95% | |
---|---|---|---|
Dose (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |
Nesses resultados, o modelo usa o nível de dosagem de um medicamento para predizer a presença ou ausência de bactéria em adultos. Neste exemplo, a ausência de bactérias é o Evento. Cada comprimido contém uma dose de 0,5 mg, portanto, os pesquisadores usam uma mudança de unidade de 0,5 mg. A razão de chances é de aproximadamente 6. Para cada comprimido adicional que um adulto ingere, as chances de que um paciente não tenha a bactéria aumenta cerca de 6 vezes.
Para preditores categóricos, a razão de chances compara as chances de o evento ocorrer em dois níveis diferentes do preditor. O Minitab define a comparação listando os níveis em duas colunas, Nível A e Nível B. Nível B é o nível de referência para o fator. A razão de chances que for maior que 1 indica que o evento é mais provável no nível A. A razão de chances que for menor do que 1 indica que o evento é menos provável no nível A. Para obter mais informações sobre codificação de preditores categóricos, acesse Esquemas de codificação para preditores categóricos.
Nível A | Nível B | Razão de Chances | IC de 95% |
---|---|---|---|
Mês | |||
2 | 1 | 1,1250 | (0,0600; 21,0834) |
3 | 1 | 3,3750 | (0,2897; 39,3165) |
4 | 1 | 7,7143 | (0,7461; 79,7592) |
5 | 1 | 2,2500 | (0,1107; 45,7172) |
6 | 1 | 6,0000 | (0,5322; 67,6397) |
3 | 2 | 3,0000 | (0,2547; 35,3325) |
4 | 2 | 6,8571 | (0,6556; 71,7169) |
5 | 2 | 2,0000 | (0,0976; 41,0019) |
6 | 2 | 5,3333 | (0,4679; 60,7946) |
4 | 3 | 2,2857 | (0,4103; 12,7323) |
5 | 3 | 0,6667 | (0,0514; 8,6389) |
6 | 3 | 1,7778 | (0,2842; 11,1200) |
5 | 4 | 0,2917 | (0,0252; 3,3719) |
6 | 4 | 0,7778 | (0,1464; 4,1326) |
6 | 5 | 2,6667 | (0,2124; 33,4861) |
Nesses resultados, o preditor categórico é o mês de início de uma estação atarefada do hotel. As resposta é se um hóspede cancela uma reserva ou não. Neste exemplo, um cancelamento é o Evento. A maior razão de chances é de aproximadamente 7,71, quando o nível A é o mês 4 e o nível B é o mês 1. Isso indica que as chances de que um hóspede cancele uma reserva no mês 4 é de aproximadamente 8 vezes mais alta do que as chances de um hóspede cancelar uma reserva no mês 1.
Para obter mais informações, acesse Razões de chances para Ajustar modelo logístico binário.
Para determinar quão bem o modelo se ajusta aos seus dados, examine as estatísticas na tabela Resumo do modelo.
Muitas das estatísticas de resumo do modelo e de qualidade de ajuste são afetadas pelo modo como os dados são organizados na worksheet e se há um ensaio por linha ou vários ensaios por linha. O teste de Hosmer-Lemeshow não é afetado pelo formato dos dados é comparável entre os formatos. Para obter mais informações, acesse Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.
Normalmente, quanto maior o R2 de deviance, melhor o modelo ajusta os dados. O R2 de deviance está sempre entre 0 e 100%.
O R2 de deviance sempre aumenta quando são adicionais mais preditores a um modelo. Por exemplo, o melhor modelo de cinco preditores terá sempre um R2 que tem no mínimo a mesma elevação que o melhor modelo de quatro preditores. Portanto, R2 da desviância é mais útil quando for comparado a modelos do mesmo tamanho.
Para a regressão logística binária, o formato dos dados afeta o valor de R2 de deviance. O R2 de deviance é geralmente mais elevado para os dados em formato de Eventos/Ensaio. Os valores de R2 de deviance só são comparáveis entre os modelos que usam o mesmo formato de dados.
A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um valor desejável, você deve verificar os gráficos de resíduos e testes de qualidade do ajuste para avaliar se um modelo ajusta bem os dados.
Use o R2 de deviance ajustado quando desejar comparar modelos que têm diferentes números de preditores. O R2 de deviance sempre aumenta quando é adicionado um preditor ao modelo. O valor de R2 de deviance ajustado incorpora o número de preditores no modelo para ajudá-lo a escolher o modelo correto.
Use o AIC, AICc e BIC para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis. No entanto, o modelo com o menor valor para um conjunto de preditores não necessariamente ajusta bem os dados. Use também os testes de qualidade do ajuste e os gráficos de resíduos para avaliar se um modelo ajusta bem os dados.
A área sob os valores da curva ROC variam de 0,5 a 1. Quando o modelo binário consegue separar perfeitamente as classes, a área abaixo da curva é 1. Quando o modelo binário não pode separar as classes melhor do que uma atribuição aleatória, então a área sob a curva é de 0,5.
R2 Deviance | R2 (Aj.) Deviance | AIC | AICc | BIC | Área sob a curva ROC |
---|---|---|---|---|---|
96,04% | 91,81% | 10,63 | 14,63 | 10,22 | 0,9398 |
Nesses resultados, o modelo explica 96,04% do total de deviance na variável resposta. Para esses dados, o valor R2 de deviance indica que o modelo fornece um bom ajuste para os dados. A área sob a curva ROC é de 0.9398% Esse valor indica que o modelo classifica boa parte dos dados corretamente. Se modelos adicionais estiverem ajustados com preditores diferentes, use o valor R2 de deviance ajustado, o valor de AIC, o valor de AICc e o valor de BIC para comparar o nível de ajuste do modelo aos dados.
Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.
Para a regressão logística binária, o formato dos dados afeta o valor de p, pois altera o número de ensaios por linha.
Variável | Valor | Contagem | Nome do Evento |
---|---|---|---|
Evento | Evento | 160 | Evento |
Não-evento | 340 | ||
Avaliação | Total | 500 |
Teste | GL | Qui-Quadrado | Valor-P |
---|---|---|---|
Deviance | 2 | 3,78 | 0,151 |
Pearson | 2 | 3,76 | 0,152 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
Nesses resultados, a tabela Informações de resposta mostra Evento e Ensaio na coluna Variável. Esses rótulos indicam que os dados estão no formato Evento/Ensaio. Todos os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Os testes não fornecem evidências de que as probabilidades estimadas desviam das probabilidades observadas de uma forma que a distribuição binomial não prediz.
Variável | Valor | Contagem | |
---|---|---|---|
Y | Evento | 160 | (Evento) |
Não evento | 340 | ||
Total | 500 |
Teste | GL | Qui-Quadrado | Valor-P |
---|---|---|---|
Deviance | 497 | 552,03 | 0,044 |
Pearson | 497 | 504,42 | 0,399 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
Nesses resultados para os mesmos dados, a tabela Informações de resposta mostra Y na coluna de variáveis. Este rótulo indica que os dados estão no formato de Resposta/Frequência binária. O teste deviance tem um valor-p menor do que o nível de significância usual de 0,05, mas o teste de Hosmer-Lemeshow é o teste mais confiável. O teste de Hosmer-Lemeshow não fornece evidências de que as probabilidades preditas se desviam das probabilidades observadas de uma forma que a distribuição binomial não prediz.