Métodos e fórmulas para ajustes e resíduos em Ajuste do modelo de regressão e Régression linéaire

Selecione o método ou a fórmula de sua escolha.

Ajuste

Notação

TermoDescrição
valor ajustado
xkko termo. Cada termo pode ser um único preditor, um termo polinomial ou um termo de interação.
bkestimativa do ko coeficiente de regressão

Erro padrão do valor ajustado (EP Fit)

O erro padrão do valor ajustado em um modelo de regressão com um preditor é:

O erro padrão do valor ajustado em um modelo de regressão com mais de um preditor é:

Para regressão ponderada, inclua a matriz de peso na equação:

Quando os dados têm um conjunto de dados de teste ou validação cruzada k-fold, as fórmulas são as mesmas. O valor de s2 é dos dados de treinamento. A matriz de design e a matriz de peso também são dos dados de treinamento.

Notação

TermoDescrição
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xiio predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Intervalo de confiança para um valor ajustado (IC)

Fórmula

Para a regressão, a fórmula a seguir dá os limites de confiança para um valor ajustado:

Para a regressão ponderada, a fórmula inclui os pesos:

em que tv é o quantil 1-α/2 da distribuição t com v graus de liberdade para um intervalo bilateral. Para um limite unilateral, tv é o quantil 1-α da distribuição t com v graus de liberdade.

Quando você usa um conjunto de dados de teste ou validação cruzada de K dobras, os graus de liberdade e o quadrado médio do erro são do conjunto de dados de treinamento.

Quando você usar uma transformação de Box-Cox, aplique a transformação inversa à fórmula do intervalo de confiança para localizar os limites nas unidades da resposta originais. Por exemplo, se a transformação de Box-Cox é o log natural, então a fórmula a seguir dá a transformação inversa:

Notação

TermoDescrição
fitted value
quantile from the t distribution
degrees of freedom
mean square error
leverage for the io observation
wiweight for the io observation

Resíduos

Um resíduo é a diferença entre um valor observado e o valor ajustado correspondente. Esta parte da observação não é explicada pelo modelo. O resíduo de uma observação é:

Notação

TermoDescrição
yiiésimo valor de resposta observado
iésimo valor ajustado para a resposta

Resíduo padronizado (Std Resid)

Resíduos padronizados também são chamados de "resíduos estudentizados internamente".

Fórmula

Notação

TermoDescrição
ei i o resíduo
hi i o elemento diagonal de X(X'X)–1X'
s2 quadrado médio do erro
Xmatriz do experimento
X'transposição da matriz do experimento

Resíduos padronizados (Resíd Pad) com validação

Para os dados de validação, o denominador da fórmula para os resíduos padronizados adiciona o leverage em vez de subtraí-lo.

Fórmula

Para regressão ponderada, a fórmula inclui o peso:

Notação

TermoDescrição
eiio residual in the validation data set
hi leverage for the io validation row
s2mean square error for the training data set
wiweight for the io observation in the validation data set

Resíduos (estudentizados) excluídos

Também chamados de resíduos estudentizados externamente. A fórmula é:

Outra apresentação desta fórmula é:

O modelo que estima a ia observação omite a ia observação do conjunto de dados. Portanto, a ia observação não pode influenciar a estimativa. Cada resíduo excluído tem distribuição t de Student com graus de liberdade.

Notação

TermoDescrição
eiiésimo residual
s(i)2erro de quadrado médio calculado sem a ia observação
hi i ésimo elemento diagonal de X(X'X)–1X'
nnúmero de observações
pnúmero de termos, incluindo a constante
SSEsoma dos quadrados para erro