Gráficos de resíduos para Ajustar modelo logístico binário

Encontre definições e orientação de interpretação para cada gráfico de resíduos.

Histograma de resíduos

O histograma dos resíduos de deviance mostra a distribuição dos resíduos para todas as observações.

A interpretação do gráfico é igual a quando você usa resíduos de deviance ou resíduos de Pearson. Quando o modelo utiliza a função de ligação logito, a distribuição dos resíduos de deviance é mais próxima da distribuição dos resíduos a partir de um modelo de regressão de mínimos quadrados. Os resíduos de deviance e os resíduos de Pearson se tornam mais semelhantes, pois o número de ensaios para cada combinação de configuração de preditor aumenta.

Interpretação

Use o histograma dos resíduos para determinar se os dados são assimétricos ou se incluem outliers. Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo. Quando o modelo não atende aos pressupostos, os intervalos de confiança com aproximação normal para predições são provavelmente imprecisos.
Padrão O que o padrão pode indicar
Uma longa cauda em uma direção Assimetria
Uma barra que está longe das outras barras Um outlier

Como a aparência de um histograma depende do número de intervalos usado para agrupar os dados, não use um histograma para avaliar a normalidade dos resíduos. Em vez disso, use um gráfico de probabilidade normal.

Gráficos de probabilidade normal de resíduos

Um gráfico de probabilidade normal dos resíduos mostra os resíduos versus seus valores esperados quando a distribuição é normal.

A interpretação do gráfico é igual a quando você usa resíduos de deviance ou resíduos de Pearson. Quando o modelo utiliza a função de ligação logito, a distribuição dos resíduos de deviance é mais próxima da distribuição dos resíduos a partir de um modelo de regressão de mínimos quadrados. Os resíduos de deviance e os resíduos de Pearson se tornam mais semelhantes, pois o número de ensaios para cada combinação de configuração de preditor aumenta.

Interpretação

Use o gráfico de probabilidade normal de resíduos para verificar a pressuposição de que os resíduos são distribuídos normalmente. O gráfico de probabilidade normal dos resíduos deve seguir aproximadamente uma linha reta.

Os seguintes padrões violam o pressuposto de que os resíduos são normalmente distribuídos.

A curva S sugere uma distribuição com caudas longas.

A curva S invertida sugere uma distribuição com caudas curtas.

A curva descendente implica uma distribuição assimétrica à direita.

Alguns pontos situados longe da linha sugerem uma distribuição com outliers.

Se você vir um padrão não-normal, use os outros gráficos de resíduos para verificar outros problemas com o modelo, como termos faltantes ou um efeito de ordem de tempo. Se os resíduos não seguirem uma distribuição normal, os intervalos de confiança de aproximação normal e os valores-p do teste de Wald podem ser inexatos.

Resíduos versus ajustes

O gráfico de resíduos versus ajustes representa graficamente os resíduos no eixo Y e os logits dos ajustes no eixo X.
Observação

Na regressão logística binária, o Minitab não fornece este gráfico quando os dados estão no formato de Resposta/Frequência binária (um único ensaio por linha).

A interpretação do gráfico é igual a quando você usa resíduos de deviance ou resíduos de Pearson. Quando o modelo utiliza a função de ligação logito, a distribuição dos resíduos de deviance é mais próxima da distribuição dos resíduos a partir de um modelo de regressão de mínimos quadrados. Os resíduos de deviance e os resíduos de Pearson se tornam mais semelhantes, pois o número de ensaios para cada combinação de configuração de preditor aumenta.

Interpretação

Use o gráfico de resíduos versus ajustes para verificar a pressuposição de que os resíduos são aleatoriamente distribuídos. De maneira ideal, os pontos devem cair aleatoriamente em ambos os lados de 0, sem padrões reconhecíveis nos pontos.

Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo.
Padrão O que o padrão pode indicar
Dispersão grande ou irregular de resíduos entre valores ajustados Uma função de link inadequada
Curvilíneo Um termo de ordem superior faltante ou uma função de link inadequada
Um ponto que está distante de zero Um outlier
Um ponto que é distante dos outros pontos na direção x Um ponto influente
Os gráficos a seguir mostram um outlier e uma violação do pressuposto de que a variância dos resíduos é constante.
Gráfico com outlier

Um dos pontos é muito maior do que todos os outros pontos. Portanto, a questão é um outlier. Se houver muitos outliers, o modelo pode não ser aceitável. Você deve tentar identificar a causa de todos os outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.

Gráfico com variância não constante

A variância dos resíduos aumenta com os valores ajustados. Observe que, como o valor dos ajustes aumenta, a dispersão entre os resíduos se torna mais ampla. Este padrão indica que as variâncias dos resíduos são desiguais (não constante).

Se você identificar alguns padrões ou outliers em seu gráfico de resíduos versus ajustes, considere as seguintes soluções:
Problema Solução possível
Variância não constante Considere o uso de termos diferentes no modelo, uma função de link diferente ou pesos.
Um outlier ou ponto influente
  1. Verifique se a observação não é um erro de medição ou erro de entrada de dados.
  2. Considere fazer a análise sem esta observação para determinar como ela impacta seus resultados.

Resíduos versus ordem

O gráfico de resíduos versus ordem mostra os resíduos na ordem em que os dados foram coletados.

A interpretação do gráfico é igual a quando você usa resíduos de deviance ou resíduos de Pearson. Quando o modelo utiliza a função de ligação logito, a distribuição dos resíduos de deviance é mais próxima da distribuição dos resíduos a partir de um modelo de regressão de mínimos quadrados. Os resíduos de deviance e os resíduos de Pearson se tornam mais semelhantes, pois o número de ensaios para cada combinação de configuração de preditor aumenta.

Interpretação

Use o gráfico de resíduos versus ordem para verificar o pressuposto de que os resíduos são independentes um do outro. Resíduos independentes não mostram tendências nem padrões quando exibidos em ordem temporal. Os padrões nos pontos podem indicar que os resíduos próximos uns dos outros podem ser correlacionados e, portanto, não são independentes. De maneira ideal, os resíduos no gráfico devem cair aleatoriamente em torno da linha central:
Se você vir um padrão, investigue a causa. Os seguintes tipos de padrões podem indicar que os resíduos são dependentes.
Tendência
Deslocamento
Ciclo

Resíduos versus as variáveis

O gráfico de resíduos versus variáveis apresenta os resíduos comparados com outras variáveis. A variável já pode estar incluída em seu modelo. Ou, a variável pode não estar no modelo, mas você suspeita que afeta a resposta.

A interpretação do gráfico é igual a quando você usa resíduos de deviance ou resíduos de Pearson. Quando o modelo utiliza a função de ligação logito, a distribuição dos resíduos de deviance é mais próxima da distribuição dos resíduos a partir de um modelo de regressão de mínimos quadrados. Os resíduos de deviance e os resíduos de Pearson se tornam mais semelhantes, pois o número de ensaios para cada combinação de configuração de preditor aumenta.

Interpretação

Se a variável já estiver incluída no modelo, use o gráfico para determinar se você deve adicionar um termo de ordem mais alta da variável. Se a variável ainda não estiver incluída no modelo, use o gráfico para determinar se a variável está afetando a resposta de uma maneira sistemática.

Estes padrões podem identificar uma importante variável ou termo.
Padrão O que o padrão pode indicar
Padrão em resíduos A variável afeta a resposta de forma sistemática. Se a variável não estiver em seu modelo, inclua um termo para aquela variável, e torne a ajustar o modelo.
Curvatura nos pontos Um termo de ordem mais alta da variável deve ser incluído no modelo. Por exemplo, um padrão curvado indica que você deve adicionar um termo quadrado.