Métodos e fórmulas para valores ajustados e resíduos em Regressão de mínimos quadrados parciais

Selecione o método ou a fórmula de sua escolha.

Neste tópico

Valores ajustados
Valores ajustados da validação cruzada
Resíduos
Resíduos da validação cruzada
Resíduo padronizado (Std Resid)
Erro padrão do valor ajustado (EP Fit)
Intervalo de confiança
Intervalo da predição

Valores ajustados

O Y predito ou é o valor da resposta média para os dados valores da preditora usando-se a equação de regressão estimada.

Valores ajustados da validação cruzada

Os valores ajustados da validação cruzada indicam quão bem seu modelo prediz os dados. Esses valores são similares aos valores ajustados ordinários, que indicam quão bem seu modelo ajusta os dados. Para obter valores ajustados da validação cruzada para uma observação, ele deve ser removido dos dados usados para calcular o modelo e depois o ajuste é calculado com o vetor do coeficiente que é independente da observação. A fórmula para os valores ajustados da validação cruzada é a seguinte:

Notação

Termo	Descrição
\i	Indica que a observação i foi deixada fora do cálculo do modelo
b_0\i	o intercepto do modelo que não inclui a observação i
X	os valores da preditora
B_{(\i)(j, k)}	os coeficientes do modelo que não incluem a observação i

Resíduos

Um resíduo é a diferença entre um valor observado e o valor ajustado correspondente. Esta parte da observação não é explicada pelo modelo. O resíduo de uma observação é:

Notação

Termo	Descrição
y_i	i^ésimo valor de resposta observado
	i^ésimo valor ajustado para a resposta

Resíduos da validação cruzada

Os resíduos da validação cruzada medem a capacidade preditiva do modelo e são usados para calcular a estatística PRESS. Os resíduos da validação cruzada no PLS e a regressão de mínimos quadrados são conceitualmente similares, mas seus cálculos diferem.

Fórmula

No PLS, resíduos da validação cruzada são as diferenças entre os valores reais das respostas e os valores ajustados da validação cruzada.

O valor dos resíduos da validação cruzada está baseado em quantas observações são omitidas cada vez que o modelo é recalculado durante a validação cruzada.

Na regressão de mínimos quadrados, os resíduos da validação cruzada são calculados diretamente a partir dos resíduos ordinários.

Notação

Termo	Descrição
(i)	observação omitida a partir do cálculo do modelo
y_i	valor de resposta
	valor ajustado da validação cruzada

Resíduo padronizado (Std Resid)

Resíduos padronizados também são chamados de "resíduos estudentizados internamente".

Fórmula

Notação

Termo	Descrição
e_i	i ^o resíduo
h_i	i ^o elemento diagonal de X(X'X)^–1X'
s²	quadrado médio do erro
X	matriz do experimento
X'	transposição da matriz do experimento

Erro padrão do valor ajustado (EP Fit)

O erro padrão do valor ajustado em um modelo de regressão com um preditor é:

O erro padrão do valor ajustado em um modelo de regressão com mais de um preditor é:

Para regressão ponderada, inclua a matriz de peso na equação:

Quando os dados têm um conjunto de dados de teste ou validação cruzada k-fold, as fórmulas são as mesmas. O valor de s² é dos dados de treinamento. A matriz de design e a matriz de peso também são dos dados de treinamento.

Notação

Termo	Descrição
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^o predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

Intervalo de confiança

O intervalo de confiança é o período no qual se espera que a resposta média estimada de um dado conjunto de valores da preditora caia. O intervalo é definido pelos limites inferiores e superiores, que o Minitab calcula a partir do nível de confiança e o erro padrão dos ajustes.

Fórmula

Notação

Termo	Descrição
α	valor alfa
n	número de observações
p	número de preditoras

s²	quadrado médio do erro
S²(b)	matriz de variância-covariância dos coeficientes

Intervalo da predição

O intervalo de predição é aquele em que se espera que a resposta ajustada para uma nova observação caia.

Fórmula

Notação

Termo	Descrição
s(Pred)
	valor ajustado para a resposta para um dado conjunto de valores do preditor
α	nível de significância
n	número de observações
p	número de parâmetros modelo
s ²	quadrado médio do erro
X	matriz preditora
X₀	vetor de valores de determinado preditor com uma coluna e p linhas
X'₀	transposição do novo vetor de valores de preditores com uma linha e p colunas