O Minitab calcula 3 tipos de resíduos.
Um resíduo é a diferença entre um valor observado (y) e seu valor ajustado correspondente ().
Represente graficamente os resíduos, e use outras estatísticas de diagnóstico para determinar se seu modelo é adequado e os pressupostos de regressão estão sendo atendidos. Os resíduos também podem identificar o quanto um modelo explica a variação nos dados observados.
O resíduo padronizado é igual ao valor de um resíduo, ei, dividido por uma estimativa de seu desvio padrão. Resíduos padronizados maiores que 2 e menores que 2 são geralmente considerados grandes, e o Minitab identifica essas observações com a letra 'R' na tabela de observações atípicas e na tabela de ajustes e resíduos. As observações que o Minitab rotula não seguem bem a equação de regressão proposta. No entanto, espera-se que você tenha algumas observações incomuns. Por exemplo, com base nos critérios de grandes resíduos padronizados, espera-se que aproximadamente 5% das observações sejam sinalizadas como tendo um grande resíduo padronizados.
Use o resíduo padronizado para ajudar a detectar outliers. Resíduos padronizados são úteis porque resíduos brutos podem não ser identificadores aceitáveis de outliers quando possuem variância não constante. Se resíduos com valores x mais distantes de possuem variação maior do que resíduos com valores x mais próximos de então outliers são mais difíceis de detectar. A padronização controla essa variação não constante, e todos os resíduos padronizados possuem o mesmo desvio padrão.
Resíduos padronizados também são chamados de resíduos estudentizados internamente.
O resíduo estudentizado deletado de uma observação é calculado dividindo-se o resíduo deletado de uma observação por uma estimativa de seu desvio padrão. Um resíduo deletado di é a diferença entre yi e seu valor ajustado em um modelo que omite a ia observação de seus cálculos. A observação é omitida para determinar como o modelo se comporta sem esse outlier potencial. Quando uma observação possui um resíduo estudentizado deletado grande (se seu valor absoluto é maior que 2), ela pode ser um outlier nos dados.
Use o resíduo deletado para ajudar a detectar outliers. Resíduos deletados são úteis porque resíduos brutos podem não ser identificadores aceitáveis de outliers quando possuem variância não constante. Se resíduos com valores x mais distantes de possuem variação maior do que resíduos com valores x mais próximos de então outliers são mais difíceis de detectar. Todos os resíduos deletados possuem o mesmo desvio padrão.
Todos os resíduos estudentizados deletados seguem a distribuição t com (n - 1 - p) graus de liberdade, onde p é igual ao número de termos no modelo de regressão.
Resíduos estudentizados deletados também são chamados de resíduos estudentizados externamente ou resíduos t deletados.