O histograma dos resíduos mostra a distribuição dos resíduos para todas as observações.
Padrão | O que o padrão pode indicar |
---|---|
Uma cauda longa em uma direção | Assimetria |
Um bar que está distante das outras barras | Um outlier |
Como a aparência de um histograma depende do número de intervalos utilizados para agrupar os dados, não use um histograma para avaliar a normalidade dos resíduos. Em vez disso, use um gráfico de probabilidade normal.
Um histograma é mais eficaz quando você tem aproximadamente 20 pontos de dados ou mais. Se a amostra for pequena demais, cada barra no histograma não conterá pontos de dados suficientes para mostrar de forma confiável a assimetria ou os outliers.
Um gráfico de probabilidade normal dos resíduos mostra os resíduos versus seus valores esperados quando a distribuição é normal.
Se o fator de lote for aleatório, use os resíduos condicionais para avaliar a normalidade.
Use o gráfico de probabilidade normal de resíduos para verificar a pressuposição de que os resíduos são distribuídos normalmente. O gráfico de probabilidade normal dos resíduos deve seguir aproximadamente uma linha reta.
A curva S sugere uma distribuição com caudas longas.
A curva S invertida sugere uma distribuição com caudas curtas.
A curva descendente implica uma distribuição assimétrica à direita.
Alguns pontos situados longe da linha sugerem uma distribuição com outliers.
Se você vir um padrão não normal, use os outros gráficos de resíduo para verificar outros problemas com o modelo, como uma variância não constante ou um efeito de ordem de tempo. Se os resíduos não seguirem uma distribuição normal e os dados tiverem menos que 15 observações, então os intervalos de confiança para preditoras, intervalos de confiança para coeficientes e os valores-p para coeficientes podem ser inexatos.
Um dos pontos é muito maior do que todos os outros pontos. Portanto, a questão é um outlier. Se houver muitos outliers, o modelo pode não ser aceitável. Você deve tentar identificar a causa de todos os outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.
A variância dos resíduos aumenta com os valores ajustados. Observe que, como o valor dos ajustes aumenta, a dispersão entre os resíduos se torna mais ampla. Este padrão indica que as variâncias dos resíduos são desiguais (não constante).
Se você identificar quaisquer padrões ou outliers no gráfico de resíduos versus o gráfico de ajustes, considere as seguintes soluções:
Problema | Solução possível |
---|---|
Variância não constante | Considere usar uma transformação de Box-Cox. Para obter mais informações, vá para Realizar a transformação de Box-Cox para Estudo de estabilidade. |
Um outlier ou ponto influente |
|
O gráfico de resíduos versus ordem mostra os resíduos na ordem em que os dados foram coletados.
O gráfico de resíduos versus variáveis apresenta os resíduos comparados com outras variáveis. A variável já pode estar incluída em seu modelo. Ou, a variável pode não estar no modelo, mas você suspeita que afeta a resposta.
Se você observar um padrão não aleatória nos resíduos, isso indica que a variável afeta a resposta de uma forma sistemática. Considere a inclusão desta variável em uma análise.