Métodos e fórmulas para valores ajustados e resíduos em Regressão de mínimos quadrados parciais

Selecione o método ou a fórmula de sua escolha.

Valores ajustados

O Y predito ou é o valor da resposta média para os dados valores da preditora usando-se a equação de regressão estimada.

Valores ajustados da validação cruzada

Os valores ajustados da validação cruzada indicam quão bem seu modelo prediz os dados. Esses valores são similares aos valores ajustados ordinários, que indicam quão bem seu modelo ajusta os dados. Para obter valores ajustados da validação cruzada para uma observação, ele deve ser removido dos dados usados para calcular o modelo e depois o ajuste é calculado com o vetor do coeficiente que é independente da observação. A fórmula para os valores ajustados da validação cruzada é a seguinte:

Notação

TermoDescrição
\iIndica que a observação i foi deixada fora do cálculo do modelo
b0\io intercepto do modelo que não inclui a observação i
Xos valores da preditora
B(\i)(j, k)os coeficientes do modelo que não incluem a observação i

Resíduos

Um resíduo é a diferença entre um valor observado e o valor ajustado correspondente. Esta parte da observação não é explicada pelo modelo. O resíduo de uma observação é:

Notação

TermoDescrição
yiiésimo valor de resposta observado
iésimo valor ajustado para a resposta

Resíduos da validação cruzada

Os resíduos da validação cruzada medem a capacidade preditiva do modelo e são usados para calcular a estatística PRESS. Os resíduos da validação cruzada no PLS e a regressão de mínimos quadrados são conceitualmente similares, mas seus cálculos diferem.

Fórmula

No PLS, resíduos da validação cruzada são as diferenças entre os valores reais das respostas e os valores ajustados da validação cruzada.

O valor dos resíduos da validação cruzada está baseado em quantas observações são omitidas cada vez que o modelo é recalculado durante a validação cruzada.

Na regressão de mínimos quadrados, os resíduos da validação cruzada são calculados diretamente a partir dos resíduos ordinários.

Notação

TermoDescrição
(i) observação omitida a partir do cálculo do modelo
yivalor de resposta
valor ajustado da validação cruzada

Resíduo padronizado (Std Resid)

Resíduos padronizados também são chamados de "resíduos estudentizados internamente".

Fórmula

Notação

TermoDescrição
ei i o resíduo
hi i o elemento diagonal de X(X'X)–1X'
s2 quadrado médio do erro
Xmatriz do experimento
X'transposição da matriz do experimento

Erro padrão do valor ajustado (EP Fit)

O erro padrão do valor ajustado em um modelo de regressão com um preditor é:

O erro padrão do valor ajustado em um modelo de regressão com mais de um preditor é:

Para regressão ponderada, inclua a matriz de peso na equação:

Quando os dados têm um conjunto de dados de teste ou validação cruzada k-fold, as fórmulas são as mesmas. O valor de s2 é dos dados de treinamento. A matriz de design e a matriz de peso também são dos dados de treinamento.

Notação

TermoDescrição
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xiio predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Intervalo de confiança

O intervalo de confiança é o período no qual se espera que a resposta média estimada de um dado conjunto de valores da preditora caia. O intervalo é definido pelos limites inferiores e superiores, que o Minitab calcula a partir do nível de confiança e o erro padrão dos ajustes.

Fórmula

Notação

TermoDescrição
α valor alfa
nnúmero de observações
pnúmero de preditoras
s2quadrado médio do erro
S2(b)matriz de variância-covariância dos coeficientes

Intervalo da predição

O intervalo de predição é aquele em que se espera que a resposta ajustada para uma nova observação caia.

Fórmula

Notação

TermoDescrição
s(Pred)
valor ajustado para a resposta para um dado conjunto de valores do preditor
αnível de significância
nnúmero de observações
pnúmero de parâmetros modelo
s 2quadrado médio do erro
Xmatriz preditora
X0vetor de valores de determinado preditor com uma coluna e p linhas
X'0transposição do novo vetor de valores de preditores com uma linha e p colunas