Interpretar os principais resultados para Gráfico de linha ajustada binária

Conclua as etapas a seguir para interpretar um gráfico binário de linha ajustada. A saída principal inclui o valor-p, o gráfico de linha ajustada, o R2 deviance e os gráficos de resíduos.

Etapa 1: Determinar se a associação entre a resposta e a variável preditora é estatisticamente significativa

Para determinar se a associação entre a variável de resposta e a variável preditora é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que o coeficiente para a variável preditora é igual a zero, o que indica que não há associação entre a variável preditora e a variável de resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e a variável preditora.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e a variável preditora.

Análise de Variância

FonteGLDesv (Aj.)Média (Aj.)Qui-QuadradoValor-P
Regressão122,705222,705222,710,000
  Dose (mg)122,705222,705222,710,000
Erro40,93730,2343   
Total523,6425     
Resultados principais: valor-p

Nestes resultados, o valor-p para dose é 0,000, que é maior do que o nível de significância de 0,05. Esses resultados indicam que a associação entre a dose e a presença de bactéria no final do tratamento é estatisticamente significativa.

Etapa 2: Compreender os efeitos das preditoras

Use a razão de chances para compreender o efeito de uma preditora. O Minitab calcula razões de chances quando o modelo usa a função de ligação logit.

As razões de chances que são maiores do que 1 indicam que o evento tem mais probabilidade de ocorrer conforme a preditora aumenta. As razões de chances que não menos do que 1 indicam que o evento tem menos probabilidade de ocorrer conforme a preditora aumenta.

Razões de Chances para Preditores Contínuos

Unidade
de
Mudança
Razão de
Chances
IC de 95%
Dose (mg)0,56,1279(1,7218; 21,8087)
Resultado principal: Razão de chances

Nesses resultados, o modelo usa o nível de dosagem de um medicamento para predizer a presença ou ausência de bactéria em adultos. Cada comprimido contém uma dose de 0,5 mg, portanto, os pesquisadores usam uma mudança de unidade de 0,5 mg. A razão de chances é de aproximadamente 6. Para cada comprimido adicional que um adulto ingere, as chances de que um paciente não tenha a bactéria aumenta cerca de 6 vezes.

Use o gráfico de linha ajustada para examinar a relação entre a variável de resposta e a variável de predição.

Principal resultado: gráfico binário de linhas ajustadas

Nestes resultados, a equação é escrita como a probabilidade de um sucesso. O valor de resposta de 1 no eixo y representa um sucesso. O gráfico mostra que a probabilidade de um sucesso diminui à medida que a temperatura aumenta. Quando as temperaturas nos dados estão perto de 50, a inclinação da linha não é muito acentuada, o que indica que a probabilidade diminui lentamente à medida que a temperatura aumenta. A linha é mais acentuado na porção média dos dados de temperatura, o que indica que uma mudança na temperatura de 1 grau exerce maior efeito sobre essa faixa. Quando a probabilidade de um sucesso se aproxima de zero na extremidade superior do intervalo de temperatura, a linha achata novamente.

Etapa 3: Determinar quão bem o modelo se ajusta aos seus dados

Para determinar quão bem o modelo se ajusta aos seus dados, examine as estatísticas na tabela Resumo do modelo. Para regressão logística binária, o formato dos dados afeta as estatísticas R2 deviance, mas não o AIC. Para obter mais informações, vá para Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.

R2 deviance

Normalmente, quanto maior o R2 de deviance, melhor o modelo ajusta os dados. O R2 de deviance está sempre entre 0 e 100%.

O R2 de deviance sempre aumenta quando você adiciona mais preditores a um modelo. Por exemplo, o melhor modelo de cinco preditores terá sempre um R2 que é pelo menos tão elevado quanto o melhor modelo de quatro preditores. Portanto, R2 de deviance é mais útil quando for comparado a modelos do mesmo tamanho.

Para a regressão logística binária, o formato dos dados afeta o valor de R2 de deviance. O R2 de deviance é geralmente mais elevado para os dados em formato de Eventos/Ensaio. Os valores de R2 de deviance só são comparáveis entre os modelos que usam o mesmo formato de dados.

O R2 deviance é apenas uma medida de quão bem o modelo se ajusta aos dados. Mesmo quando um modelo tem um R2 alto, você deve verificar os gráficos de resíduos para avaliar quão bem o modelo se ajusta aos dados.

R2 deviance (aj.)

Use o R2 de deviance ajustado quando desejar comparar modelos que têm diferentes números de preditores. O R2 de deviance sempre aumenta quando você adiciona um preditor ao modelo. O valor de R2 de deviance ajustado incorpora o número de preditores no modelo para ajudá-lo a escolher o modelo correto.

AIC, AICc e BIC
Para Gráfico de linha ajustada binária, é possível usar os critérios de informação para comparar o ajuste de diferentes funções de link ou diferentes preditores. É desejável que o resultado apresente valores menores. Contudo, o modelo com o menor valor nem sempre se ajusta bem aos dados. Além disso use o teste e os gráficos de resíduos para avaliar se o modelo ajusta bem os dados.

Sumário do Modelo

R2 DevianceR2 (Aj.)
Deviance
AICAICcBICÁrea sob a
curva ROC
96,04%91,81%10,6314,6310,220,9398
Principais Resultados: R2 deviance, R2 (aj) deviance, AIC

Nesses resultados, o modelo explica 96,04% do deviance na variável de resposta. Para esses dados, o valor R2 deviance indica que o modelo fornece um bom ajuste para os dados. Se os modelos adicionais forem ajustados com diferentes preditores, utilize outros valores para comparar se os modelos ajustam bem os dados.

Etapa 4: Determinar se o modelo atende às suposições da análise

Use os gráficos de resíduos para ajudar a determinar se o modelo é adequado e satisfaz aos pressupostos da análise. Se os pressupostos não forem satisfeitos, o modelo pode não ajustar bem os dados e você deve ter cautela ao interpretar os resultados.

Para obter mais informações sobre como lidar com os padrões nos gráficos residuais, vá para Gráficos para Gráfico de linha ajustada binária e clique no nome do gráfico residual na lista na parte superior da página.

Gráficos de resíduos versus de ajustes

Use o gráfico de resíduos versus ajustes para verificar a pressuposição de que os resíduos são aleatoriamente distribuídos. De maneira ideal, os pontos devem cair aleatoriamente em ambos os lados de 0, sem padrões reconhecíveis nos pontos.

O gráfico de resíduos versus de ajuste está disponível apenas quando os dados estão no formato Evento/Ensaio.

Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo.
Padrão O que o padrão pode indicar
Dispersão grande ou irregular de resíduos entre valores ajustados Uma função de link inadequada
Curvilíneo Um termo de ordem superior faltante ou uma função de link inadequada
Um ponto que está distante de zero Um outlier
Um ponto que é distante dos outros pontos na direção x Um ponto influente
Neste gráfico de resíduos versus valores ajustados, os dados não parecem estar aleatoriamente distribuídos em torno de zero. Não há evidências de que o valor dos resíduos depende do valor ajustado.

Gráfico de resíduos versus ordem

Use o gráfico de resíduos versus ordem para verificar o pressuposto de que os resíduos são independentes um do outro. Resíduos independentes não mostram tendências nem padrões quando exibidos em ordem temporal. Os padrões nos pontos podem indicar que os resíduos próximos uns dos outros podem ser correlacionados e, portanto, não são independentes. De maneira ideal, os resíduos no gráfico devem cair aleatoriamente em torno da linha central:
Se você vir um padrão, investigue a causa. Os seguintes tipos de padrões podem indicar que os resíduos são dependentes.
Tendência
Deslocamento
Ciclo
Neste gráfico de resíduos versus ordem, os resíduos não parecem cair aleatoriamente em torno da linha central. Não há evidências de que os resíduos não são independentes.