O que é uma observação atípica?

Observações atípicas (também chamadas de observações influentes) são aquelas que exercem um impacto desproporcional sobre um modelo de regressão ou ANOVA. As observações atípicas são importantes para identificar porque elas podem produzir resultados equivocados. Por exemplo, uma observação atípica pode fazer com que um coeficientes significativo pareça insignificante.

Observações atípicas podem ser um ou ambos os elementos abaixo:
  • Pontos de leverage, que são extremos na direção X
  • Outliers (grandes resíduos) que são extremos na direção y em relação à linha de regressão ajustada.

Identifique observações atípicas

Para identificar observações atípicas, examine medidas de diagnóstico como valores de leverage, resíduos, D de Cook e DAJUS. Valores maiores dessas estatísticas identificam que uma observação pode ser atípica. O Minitab rotula observações com valores de leverage ou resíduos extremos (outliers) na tabela de Ajustes e Diagnóstico para Observações Atípicas mostrada abaixo:
  • Um X denota um ponto com um grande valor de leverage. O Minitab rotula valores de leverage maiores que 3 * número de termos de modelo/número de observações ou valores de leverage maiores que 0,99, o que for menor.
  • Um R indica um resíduo padronizado extremo. O Minitab rotula resíduos padronizados com valores absolutos maiores que 2.

As observações que o Minitab rotula não seguem bem a equação de regressão proposta. No entanto, espera-se que você tenha algumas observações incomuns. Por exemplo, com base nos critérios de grandes resíduos, espera-se que aproximadamente 5% das observações sejam sinalizadas como tendo um resíduo grande.

Exemplo de tabela de observações atípicas

Ajustados e Diagnósticos para Observações Atípicas Fluxo Obs. calor Ajuste Resíd Resíd Pad 1 271,80 274,74 -2,94 -0,40 X 22 254,50 230,91 23,59 2,74 R R Resíduo grande X Atípicos X

Na saída anterior, a observação 1 é marcada com um X, que a identifica como um ponto de leverage. A observação 22, marcada com R, é um outlier.

Determine como observações atípicas afetam o modelo

Para determinar quanto efeito a observação incomum exerce, você pode ajustar o modelo com e sem a observação e comparar os coeficientes, os valores-p, R2 e outros parâmetros do modelo. Se o modelo mudar significativamente quando você remover a observação atípica, primeiro, determine se a observação é uma entrada de dados ou erro de medição. Caso contrário, examine o modelo mais profundamente para determinar se você omitiu um termo importante (por exemplo, um termo de interação) ou variável, ou tenha especificado incorretamente o modelo. Você pode precisar coletar mais dados para determinar uma resolução.