Teste de Wald | |||
---|---|---|---|
Fonte | GL | Qui-Quadrado | Valor-p |
Regressão | 1 | 7,83 | 0,005 |
Dose (mg) | 1 | 7,83 | 0,005 |
Termo | Coef | EP de Coef | Valor-Z | Valor-P | VIF |
---|---|---|---|---|---|
Constante | -5,25 | 1,99 | -2,64 | 0,008 | |
Dose (mg) | 3,63 | 1,30 | 2,80 | 0,005 | 1,00 |
Nesses resultados, a dosagem é estatisticamente significativa no nível de significância de 0,05. Você pode concluir que as mudanças na dosagem estão associadas com mudanças nas probabilidades de que os eventos ocorram.
Avalie o coeficiente para determinar se uma mudança na variável preditora pode tornar o evento mais ou menos provável. A relação entre o coeficiente e as probabilidades dependem de diversos aspectos da análise, incluindo a função de ligação. Geralmente, os coeficientes positivos indicam que o evento se torna mais provável conforme a preditora aumenta. Coeficientes negativos indicam que o evento torna-se menos provável conforme a preditora aumenta. Para obter mais informações, acesse Coeficientes e equação de regressão para Ajustar modelo logístico binário e Régression logistique binaire.
O coeficiente para a dose é 3,63, o que sugere que doses maiores estão associadas a valores mais altos de que o evento ocorrerá.
Se um termo de interação for estatisticamente significativo, a relação entre uma preditora e a resposta difere pelo nível da outra preditora. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação. Para obter uma compreensão melhor dos efeitos principais, dos efeitos da interação e da curvatura em seu modelo, vá para Gráficos Fatoriais e Otimização de Resposta.
As razões de chances que são maiores do que 1 indicam que o evento tem mais probabilidade de ocorrer conforme a preditora aumenta. As razões de chances que não menos do que 1 indicam que o evento tem menos probabilidade de ocorrer conforme a preditora aumenta.
Unidade de Mudança | Razão de Chances | IC de 95% | |
---|---|---|---|
Dose (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |
Nesses resultados, o modelo usa o nível de dosagem de um medicamento para predizer a presença ou ausência de bactéria em adultos. Neste exemplo, a ausência de bactérias é o Evento. Cada comprimido contém uma dose de 0,5 mg, portanto, os pesquisadores usam uma mudança de unidade de 0,5 mg. A razão de chances é de aproximadamente 6. Para cada comprimido adicional que um adulto ingere, as chances de que um paciente não tenha a bactéria aumenta cerca de 6 vezes.
Para preditores categóricos, a razão de chances compara as chances de o evento ocorrer em dois níveis diferentes do preditor. O Minitab define a comparação listando os níveis em duas colunas, Nível A e Nível B. Nível B é o nível de referência para o fator. A razão de chances que for maior que 1 indica que o evento é mais provável no nível A. A razão de chances que for menor do que 1 indica que o evento é menos provável no nível A. Para obter mais informações sobre codificação de preditores categóricos, acesse Esquemas de codificação para preditores categóricos.
Nível A | Nível B | Razão de Chances | IC de 95% |
---|---|---|---|
Mês | |||
2 | 1 | 1,1250 | (0,0600; 21,0834) |
3 | 1 | 3,3750 | (0,2897; 39,3165) |
4 | 1 | 7,7143 | (0,7461; 79,7592) |
5 | 1 | 2,2500 | (0,1107; 45,7172) |
6 | 1 | 6,0000 | (0,5322; 67,6397) |
3 | 2 | 3,0000 | (0,2547; 35,3325) |
4 | 2 | 6,8571 | (0,6556; 71,7169) |
5 | 2 | 2,0000 | (0,0976; 41,0019) |
6 | 2 | 5,3333 | (0,4679; 60,7946) |
4 | 3 | 2,2857 | (0,4103; 12,7323) |
5 | 3 | 0,6667 | (0,0514; 8,6389) |
6 | 3 | 1,7778 | (0,2842; 11,1200) |
5 | 4 | 0,2917 | (0,0252; 3,3719) |
6 | 4 | 0,7778 | (0,1464; 4,1326) |
6 | 5 | 2,6667 | (0,2124; 33,4861) |
Nesses resultados, o preditor categórico é o mês de início de uma estação atarefada do hotel. As resposta é se um hóspede cancela uma reserva ou não. Neste exemplo, um cancelamento é o Evento. A maior razão de chances é de aproximadamente 7,71, quando o nível A é o mês 4 e o nível B é o mês 1. Isso indica que as chances de que um hóspede cancele uma reserva no mês 4 é de aproximadamente 8 vezes mais alta do que as chances de um hóspede cancelar uma reserva no mês 1.
Para obter mais informações, acesse Razões de chances para Ajustar modelo logístico binário e Régression logistique binaire.
Para determinar quão bem o modelo se ajusta aos seus dados, examine as estatísticas na tabela Resumo do modelo.
Muitas das estatísticas de resumo do modelo e de qualidade de ajuste são afetadas pelo modo como os dados são organizados na worksheet e se há um ensaio por linha ou vários ensaios por linha. O teste de Hosmer-Lemeshow não é afetado pelo formato dos dados é comparável entre os formatos. Para obter mais informações, acesse Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.
Normalmente, quanto maior o R2 de deviance, melhor o modelo ajusta os dados. O R2 de deviance está sempre entre 0 e 100%.
O R2 de deviance sempre aumenta quando são adicionais mais preditores a um modelo. Por exemplo, o melhor modelo de cinco preditores terá sempre um R2 que tem no mínimo a mesma elevação que o melhor modelo de quatro preditores. Portanto, R2 da desviância é mais útil quando for comparado a modelos do mesmo tamanho.
Para a regressão logística binária, o formato dos dados afeta o valor de R2 de deviance. O R2 de deviance é geralmente mais elevado para os dados em formato de Eventos/Ensaio. Os valores de R2 de deviance só são comparáveis entre os modelos que usam o mesmo formato de dados.
A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um valor desejável, você deve verificar os gráficos de resíduos e testes de qualidade do ajuste para avaliar se um modelo ajusta bem os dados.
Use o R2 de deviance ajustado quando desejar comparar modelos que têm diferentes números de preditores. O R2 de deviance sempre aumenta quando é adicionado um preditor ao modelo. O valor de R2 de deviance ajustado incorpora o número de preditores no modelo para ajudá-lo a escolher o modelo correto.
Use o AIC, AICc e BIC para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis. No entanto, o modelo com o menor valor para um conjunto de preditores não necessariamente ajusta bem os dados. Use também os testes de qualidade do ajuste e os gráficos de resíduos para avaliar se um modelo ajusta bem os dados.
A área sob os valores da curva ROC variam de 0,5 a 1. Quando o modelo binário consegue separar perfeitamente as classes, a área abaixo da curva é 1. Quando o modelo binário não pode separar as classes melhor do que uma atribuição aleatória, então a área sob a curva é de 0,5.
R2 Deviance | R2 (Aj.) Deviance | AIC | AICc | BIC | Área sob a curva ROC |
---|---|---|---|---|---|
96,04% | 91,81% | 10,63 | 14,63 | 10,22 | 0,9398 |
Nesses resultados, o modelo explica 96,04% do total de deviance na variável resposta. Para esses dados, o valor R2 de deviance indica que o modelo fornece um bom ajuste para os dados. A área sob a curva ROC é de 0.9398% Esse valor indica que o modelo classifica boa parte dos dados corretamente. Se modelos adicionais estiverem ajustados com preditores diferentes, use o valor R2 de deviance ajustado, o valor de AIC, o valor de AICc e o valor de BIC para comparar o nível de ajuste do modelo aos dados.
Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.
Para a regressão logística binária, o formato dos dados afeta o valor de p, pois altera o número de ensaios por linha.
Variável | Valor | Contagem | Nome do Evento |
---|---|---|---|
Evento | Evento | 160 | Evento |
Não-evento | 340 | ||
Avaliação | Total | 500 |
Teste | GL | Qui-Quadrado | Valor-P |
---|---|---|---|
Deviance | 2 | 3,78 | 0,151 |
Pearson | 2 | 3,76 | 0,152 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
Nesses resultados, a tabela Informações de resposta mostra Evento e Ensaio na coluna Variável. Esses rótulos indicam que os dados estão no formato Evento/Ensaio. Todos os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Os testes não fornecem evidências de que as probabilidades estimadas desviam das probabilidades observadas de uma forma que a distribuição binomial não prediz.
Variável | Valor | Contagem | |
---|---|---|---|
Y | Evento | 160 | (Evento) |
Não evento | 340 | ||
Total | 500 |
Teste | GL | Qui-Quadrado | Valor-P |
---|---|---|---|
Deviance | 497 | 552,03 | 0,044 |
Pearson | 497 | 504,42 | 0,399 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
Nesses resultados para os mesmos dados, a tabela Informações de resposta mostra Y na coluna de variáveis. Este rótulo indica que os dados estão no formato de Resposta/Frequência binária. O teste deviance tem um valor-p menor do que o nível de significância usual de 0,05, mas o teste de Hosmer-Lemeshow é o teste mais confiável. O teste de Hosmer-Lemeshow não fornece evidências de que as probabilidades preditas se desviam das probabilidades observadas de uma forma que a distribuição binomial não prediz.
As plotagens de contorno sobrepostas estão disponíveis quando você ajusta um modelo no Estat menu.