Métodos e fórmulas para ajustes e resíduos em Ajuste do modelo de regressão e Régression linéaire

Selecione o método ou a fórmula de sua escolha.

Neste tópico

Ajuste
Erro padrão do valor ajustado (EP Fit)
Intervalo de confiança para um valor ajustado (IC)
Resíduos
Resíduo padronizado (Std Resid)
Resíduos padronizados (Resíd Pad) com validação
Resíduos (estudentizados) excluídos

Ajuste

Notação

Termo	Descrição
	valor ajustado
x_k	k^o termo. Cada termo pode ser um único preditor, um termo polinomial ou um termo de interação.
b_k	estimativa do k^o coeficiente de regressão

Erro padrão do valor ajustado (EP Fit)

O erro padrão do valor ajustado em um modelo de regressão com um preditor é:

O erro padrão do valor ajustado em um modelo de regressão com mais de um preditor é:

Para regressão ponderada, inclua a matriz de peso na equação:

Quando os dados têm um conjunto de dados de teste ou validação cruzada k-fold, as fórmulas são as mesmas. O valor de s² é dos dados de treinamento. A matriz de design e a matriz de peso também são dos dados de treinamento.

Notação

Termo	Descrição
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^o predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

Intervalo de confiança para um valor ajustado (IC)

Fórmula

Para a regressão, a fórmula a seguir dá os limites de confiança para um valor ajustado:

Para a regressão ponderada, a fórmula inclui os pesos:

em que t_v é o quantil 1-α/2 da distribuição t com v graus de liberdade para um intervalo bilateral. Para um limite unilateral, t_v é o quantil 1-α da distribuição t com v graus de liberdade.

Quando você usa um conjunto de dados de teste ou validação cruzada de K dobras, os graus de liberdade e o quadrado médio do erro são do conjunto de dados de treinamento.

Quando você usar uma transformação de Box-Cox, aplique a transformação inversa à fórmula do intervalo de confiança para localizar os limites nas unidades da resposta originais. Por exemplo, se a transformação de Box-Cox é o log natural, então a fórmula a seguir dá a transformação inversa:

Notação

Termo	Descrição
	fitted value
	quantile from the t distribution
	degrees of freedom
	mean square error
	leverage for the i^o observation
w_i	weight for the i^o observation

Resíduos

Um resíduo é a diferença entre um valor observado e o valor ajustado correspondente. Esta parte da observação não é explicada pelo modelo. O resíduo de uma observação é:

Notação

Termo	Descrição
y_i	i^ésimo valor de resposta observado
	i^ésimo valor ajustado para a resposta

Resíduo padronizado (Std Resid)

Resíduos padronizados também são chamados de "resíduos estudentizados internamente".

Fórmula

Notação

Termo	Descrição
e_i	i ^o resíduo
h_i	i ^o elemento diagonal de X(X'X)^–1X'
s²	quadrado médio do erro
X	matriz do experimento
X'	transposição da matriz do experimento

Resíduos padronizados (Resíd Pad) com validação

Para os dados de validação, o denominador da fórmula para os resíduos padronizados adiciona o leverage em vez de subtraí-lo.

Fórmula

Para regressão ponderada, a fórmula inclui o peso:

Notação

Termo	Descrição
e_i	i^o residual in the validation data set
h_i	leverage for the i^o validation row
s²	mean square error for the training data set
w_i	weight for the i^o observation in the validation data set

Resíduos (estudentizados) excluídos

Também chamados de resíduos estudentizados externamente. A fórmula é:

Outra apresentação desta fórmula é:

O modelo que estima a i^a observação omite a i^a observação do conjunto de dados. Portanto, a i^a observação não pode influenciar a estimativa. Cada resíduo excluído tem distribuição t de Student com graus de liberdade.

Notação

Termo	Descrição
e_i	i^ésimo residual
s_(i)²	erro de quadrado médio calculado sem a i^a observação
h_i	i ^ésimo elemento diagonal de X(X'X)^–1X'
n	número de observações
p	número de termos, incluindo a constante
SSE	soma dos quadrados para erro