O Y predito ou é o valor da resposta média para os dados valores da preditora usando-se a equação de regressão estimada.
Termo | Descrição |
---|---|
\i | Indica que a observação i foi deixada fora do cálculo do modelo |
b0\i | o intercepto do modelo que não inclui a observação i |
X | os valores da preditora |
B(\i)(j, k) | os coeficientes do modelo que não incluem a observação i |
Termo | Descrição |
---|---|
yi | iésimo valor de resposta observado |
iésimo valor ajustado para a resposta |
Os resíduos da validação cruzada medem a capacidade preditiva do modelo e são usados para calcular a estatística PRESS. Os resíduos da validação cruzada no PLS e a regressão de mínimos quadrados são conceitualmente similares, mas seus cálculos diferem.
No PLS, resíduos da validação cruzada são as diferenças entre os valores reais das respostas e os valores ajustados da validação cruzada.
O valor dos resíduos da validação cruzada está baseado em quantas observações são omitidas cada vez que o modelo é recalculado durante a validação cruzada.
Na regressão de mínimos quadrados, os resíduos da validação cruzada são calculados diretamente a partir dos resíduos ordinários.
Termo | Descrição |
---|---|
(i) | observação omitida a partir do cálculo do modelo |
yi | valor de resposta |
valor ajustado da validação cruzada |
Resíduos padronizados também são chamados de "resíduos estudentizados internamente".
Termo | Descrição |
---|---|
ei | i o resíduo |
hi | i o elemento diagonal de X(X'X)–1X' |
s2 | quadrado médio do erro |
X | matriz do experimento |
X' | transposição da matriz do experimento |
O erro padrão do valor ajustado em um modelo de regressão com um preditor é:
O erro padrão do valor ajustado em um modelo de regressão com mais de um preditor é:
Para regressão ponderada, inclua a matriz de peso na equação:
Quando os dados têm um conjunto de dados de teste ou validação cruzada k-fold, as fórmulas são as mesmas. O valor de s2 é dos dados de treinamento. A matriz de design e a matriz de peso também são dos dados de treinamento.
Termo | Descrição |
---|---|
s2 | mean square error |
n | number of observations |
x0 | new value of the predictor |
mean of the predictor | |
xi | io predictor value |
x0 | vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term |
x'0 | transpose of the new vector of predictor values |
X | design matrix |
W | weight matrix |
O intervalo de confiança é o período no qual se espera que a resposta média estimada de um dado conjunto de valores da preditora caia. O intervalo é definido pelos limites inferiores e superiores, que o Minitab calcula a partir do nível de confiança e o erro padrão dos ajustes.
Termo | Descrição |
---|---|
α | valor alfa |
n | número de observações |
p | número de preditoras |
s2 | quadrado médio do erro |
S2(b) | matriz de variância-covariância dos coeficientes |
O intervalo de predição é aquele em que se espera que a resposta ajustada para uma nova observação caia.
Termo | Descrição |
---|---|
s(Pred) | |
valor ajustado para a resposta para um dado conjunto de valores do preditor | |
α | nível de significância |
n | número de observações |
p | número de parâmetros modelo |
s 2 | quadrado médio do erro |
X | matriz preditora |
X0 | vetor de valores de determinado preditor com uma coluna e p linhas |
X'0 | transposição do novo vetor de valores de preditores com uma linha e p colunas |