O histograma dos resíduos mostra a distribuição dos resíduos para todas as observações.
Padrão | O que o padrão pode indicar |
---|---|
Uma cauda longa em uma direção | Assimetria |
Um bar que está distante das outras barras | Um outlier |
Como a aparência de um histograma depende do número de intervalos utilizados para agrupar os dados, não use um histograma para avaliar a normalidade dos resíduos. Em vez disso, use um gráfico de probabilidade normal.
Um histograma é mais eficaz quando você tem aproximadamente 20 pontos de dados ou mais. Se a amostra for pequena demais, cada barra no histograma não conterá pontos de dados suficientes para mostrar de forma confiável a assimetria ou os outliers.
Um gráfico de probabilidade normal dos resíduos mostra os resíduos versus seus valores esperados quando a distribuição é normal.
Se o fator de lote for aleatório, use os resíduos condicionais para avaliar a normalidade.
Use o gráfico de probabilidade normal de resíduos para verificar a pressuposição de que os resíduos são distribuídos normalmente. O gráfico de probabilidade normal dos resíduos deve seguir aproximadamente uma linha reta.
Se você vir um padrão não normal, use os outros gráficos de resíduo para verificar outros problemas com o modelo, como uma variância não constante ou um efeito de ordem de tempo. Se os resíduos não seguirem uma distribuição normal e os dados tiverem menos que 15 observações, então os intervalos de confiança para preditoras, intervalos de confiança para coeficientes e os valores-p para coeficientes podem ser inexatos.
Se você identificar quaisquer padrões ou outliers no gráfico de resíduos versus o gráfico de ajustes, considere as seguintes soluções:
Problema | Solução possível |
---|---|
Variância não constante | Considere usar uma transformação de Box-Cox. Para obter mais informações, vá para Realizar a transformação de Box-Cox para Estudo de estabilidade. |
Um outlier ou ponto influente |
|
O gráfico de resíduos versus ordem mostra os resíduos na ordem em que os dados foram coletados.
O gráfico de resíduos versus variáveis apresenta os resíduos comparados com outras variáveis. A variável já pode estar incluída em seu modelo. Ou, a variável pode não estar no modelo, mas você suspeita que afeta a resposta.
Se você observar um padrão não aleatória nos resíduos, isso indica que a variável afeta a resposta de uma forma sistemática. Considere a inclusão desta variável em uma análise.