Métodos e fórmulas para os ajustes e resíduos em Análise de experimento fatorial

Ajuste

Notação

TermoDescrição
valor ajustado
xkko termo. Cada termo pode ser um único preditor, um termo polinomial ou um termo de interação.
bkestimativa do ko coeficiente de regressão

Resíduos

Um resíduo é a diferença entre um valor observado e o valor ajustado correspondente. Esta parte da observação não é explicada pelo modelo. O resíduo de uma observação é:

Notação

TermoDescrição
yiiésimo valor de resposta observado
iésimo valor ajustado para a resposta

Resíduo padronizado (Std Resid)

Resíduos padronizados também são chamados de "resíduos estudentizados internamente".

Fórmula

Notação

TermoDescrição
ei i o resíduo
hi i o elemento diagonal de X(X'X)–1X'
s2 quadrado médio do erro
Xmatriz do experimento
X'transposição da matriz do experimento

Resíduos (estudentizados) excluídos

Também chamados de resíduos estudentizados externamente. A fórmula é:

Outra apresentação desta fórmula é:

O modelo que estima a ia observação omite a ia observação do conjunto de dados. Portanto, a ia observação não pode influenciar a estimativa. Cada resíduo excluído tem distribuição t de Student com graus de liberdade.

Notação

TermoDescrição
eiiésimo residual
s(i)2erro de quadrado médio calculado sem a ia observação
hi i ésimo elemento diagonal de X(X'X)–1X'
nnúmero de observações
pnúmero de termos, incluindo a constante
SSEsoma dos quadrados para erro

Resíduos de parcela integral

A parte da observação devida à variação integral (após a consideração dos termos modelo) em um experimento de parcelas subdivididas.

Notação

TermoDescrição
valor ajustado para o modelo completo (incluindo o termo de erro da parcela integral, bem como termos fixos)
valor ajustado usando somente os termos de efeitos fixos, não o termo de erro da parcela integral

Erro padrão do valor ajustado (EP Fit)

O erro padrão do valor ajustado em um modelo de regressão com um preditor é:

O erro padrão do valor ajustado em um modelo de regressão com mais de um preditor é:

Para regressão ponderada, inclua a matriz de peso na equação:

Quando os dados têm um conjunto de dados de teste ou validação cruzada k-fold, as fórmulas são as mesmas. O valor de s2 é dos dados de treinamento. A matriz de design e a matriz de peso também são dos dados de treinamento.

Notação

TermoDescrição
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xiio predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Erro padrão dos valores ajustados (EP Fit) para um experimento de parcelas subdivididas

Os erros padrão dos coeficientes são as raízes quadradas dos elementos diagonais da matriz de covariância.
O erro padrão do valor ajustado em um dado ponto (utilizado para intervalos de confiança) é:
O erro padrão que é utilizado nos intervalos de predição é:

Notação

TermoDescrição
componente de variância subdividido, calculado como MSE(SP)
Xn × p matriz de experimento para efeitos de fatores, covariáveis, blocos e termo da parcela integral
p componente de variância da parcela integral que, em um experimento balanceado, tem esta fórmula:
mo número de subdivisões dentro de uma parcela integral
Zn × w matriz de indicadores da parcela integral (todos os números 1 e 0)
nnúmero de linhas de dados
pnúmero de coeficientes
wnúmero de parcelas integrais
xvetor da linha dos níveis de previsão
matriz de covariância de β
βvetor de coeficientes

Intervalo de Confiança

A amplitude na qual espera-se que a resposta média estimada de um dado conjunto de valores do preditor caia.

Fórmula

Notação

TermoDescrição
valor ajustado para a resposta para um dado conjunto de valores do preditor
αtaxa de erro tipo I
nnúmero de observações
pnúmero de parâmetros modelo
S 2(b)matriz de variância-covariância dos coeficientes
s 2quadrado médio do erro
Xmatriz de planejamento
X0vetor de valores de determinado preditor com uma coluna e p linhas
X'0transposição do novo vetor de valores de preditores com uma linha e p colunas

Intervalo da predição

O intervalo de predição é aquele em que se espera que a resposta ajustada para uma nova observação caia.

Fórmula

Notação

TermoDescrição
s(Pred)
valor ajustado para a resposta para um dado conjunto de valores do preditor
αnível de significância
nnúmero de observações
pnúmero de parâmetros modelo
s 2quadrado médio do erro
Xmatriz preditora
X0vetor de valores de determinado preditor com uma coluna e p linhas
X'0transposição do novo vetor de valores de preditores com uma linha e p colunas