Quais tipos de resíduos estão incluídos no Minitab?

O Minitab calcula 3 tipos de resíduos.

Resíduos regulares

Um resíduo é a diferença entre um valor observado (y) e seu valor ajustado correspondente ().

Por exemplo, este gráfico de dispersão representa graficamente o peso das pessoas em comparação à sua altura. A linha de regressão ajustada representa graficamente os valores ajustados de peso para cada valor observado de altura. Suponha que uma pessoa tem 6 pés de altura e o valor equipado do seu peso é 190 lb. Se o peso real for 200, o resíduo é 10.

Represente graficamente os resíduos, e use outras estatísticas de diagnóstico para determinar se seu modelo é adequado e os pressupostos de regressão estão sendo atendidos. Os resíduos também podem identificar o quanto um modelo explica a variação nos dados observados.

Resíduos padronizados

O resíduo padronizado é igual ao valor de um resíduo, ei, dividido por uma estimativa de seu desvio padrão. Resíduos padronizados maiores que 2 e menores que 2 são geralmente considerados grandes, e o Minitab identifica essas observações com a letra 'R' na tabela de observações atípicas e na tabela de ajustes e resíduos. As observações que o Minitab rotula não seguem bem a equação de regressão proposta. No entanto, espera-se que você tenha algumas observações incomuns. Por exemplo, com base nos critérios de grandes resíduos padronizados, espera-se que aproximadamente 5% das observações sejam sinalizadas como tendo um grande resíduo padronizados.

Use o resíduo padronizado para ajudar a detectar outliers. Resíduos padronizados são úteis porque resíduos brutos podem não ser identificadores aceitáveis de outliers quando possuem variância não constante. Se resíduos com valores x mais distantes de possuem variação maior do que resíduos com valores x mais próximos de então outliers são mais difíceis de detectar. A padronização controla essa variação não constante, e todos os resíduos padronizados possuem o mesmo desvio padrão.

Resíduos padronizados também são chamados de resíduos estudentizados internamente.

Resíduos estudentizados deletados

O resíduo estudentizado deletado de uma observação é calculado dividindo-se o resíduo deletado de uma observação por uma estimativa de seu desvio padrão. Um resíduo deletado di é a diferença entre yi e seu valor ajustado em um modelo que omite a ia observação de seus cálculos. A observação é omitida para determinar como o modelo se comporta sem esse outlier potencial. Quando uma observação possui um resíduo estudentizado deletado grande (se seu valor absoluto é maior que 2), ela pode ser um outlier nos dados.

Use o resíduo deletado para ajudar a detectar outliers. Resíduos deletados são úteis porque resíduos brutos podem não ser identificadores aceitáveis de outliers quando possuem variância não constante. Se resíduos com valores x mais distantes de possuem variação maior do que resíduos com valores x mais próximos de então outliers são mais difíceis de detectar. Todos os resíduos deletados possuem o mesmo desvio padrão.

Todos os resíduos estudentizados deletados seguem a distribuição t com (n - 1 - p) graus de liberdade, onde p é igual ao número de termos no modelo de regressão.

Resíduos estudentizados deletados também são chamados de resíduos estudentizados externamente ou resíduos t deletados.