Métodos e fórmulas para estatísticas de qualidade de ajuste em Ajuste do modelo de regressão e Régression linéaire

Selecione o método ou a fórmula de sua escolha.

S

Notação

TermoDescrição
MSEquadrado médio do erro

R2

R2 também é conhecido como o coeficiente de determinação.

Fórmula

Notação

TermoDescrição
yi i o valor de resposta observada
resposta média
i a resposta ajustada

R2 (aj)

Enquanto os cálculos para R2 ajustado podem produzir valores negativos, o Minitab exibe zero para estes casos.

Notação

TermoDescrição
i o valor de resposta observada
ia resposta ajustada
resposta média
nnúmero de observações
po número de termos no modelo

R2 (pred)

Enquanto os cálculos para R2(pred) podem produzir valores negativos, o Minitab exibe zero para estes casos.

Notação

TermoDescrição
yi i o valor de resposta observada
resposta média
n número de observações
ei i o resíduo
hi i o elemento diagonal de X(X'X)–1X'
X matriz do experimento

PRESS

Avalia a capacidade preditiva do seu modelo e é calculado como:

Notação

TermoDescrição
nnúmero de observações
eiiésimo residual
hi

iésimo elemento diagonal de

X (X' X)-1X'

Teste S

O Teste S resume a distância entre os valores dos dados e os valores ajustados no conjunto de dados de teste. O teste S é medido nas unidades da resposta.

Fórmula

em que

.

Para regressão,

e para regressão ponderada

.

Notação

TermoDescrição
número de linhas no conjunto de dados de teste
io valor de resposta observado no conjunto de dados de teste
io valor ajustado para a resposta no conjunto de dados de teste
peso para a ia observação no conjunto de dados de teste

Teste R2

O teste R2 é a porcentagem de variação na variável resposta do conjunto de dados de teste explicada pelo modelo. O valor do teste R2 varia entre 0% e 100%. (Embora os cálculos para o teste R2 possam produzir valores negativos, o Minitab Statistical Software exibe 0 para esses casos).

Fórmula

em que utiliza-se, para regressão

e para regressão ponderada

.

A fórmula para o total das somas de quadrados também depende se os dados incluem ou não incluem pesos. Para regressão,

e para regressão ponderada
em que

Notação

TermoDescrição
número de linhas no conjunto de dados de teste
io valor de resposta observado no conjunto de dados de teste
io valor ajustado para a resposta no conjunto de dados de teste
peso para a ia observação no conjunto de dados de teste
média da resposta para o conjunto de dados de teste
média ponderada da resposta para o conjunto de dados de teste

S de K dobras

O S de K dobras resume a distância entre os valores dos dados e os valores ajustados no conjunto de dados de teste. O S de K dobras é medido nas unidades da resposta.

Fórmula

em que

.

Para regressão,

e para regressão ponderada

.

Notação

TermoDescrição
número de linhas na dobra j
io valor de resposta observado na dobra j
io valor submetido a validação cruzada e ajustado para a resposta na dobra j
Knúmero de dobras
wipeso para a ia observação na dobra j

R2 de K dobras

O R2 de K dobras é a porcentagem de variação na variável resposta das dobras de dados explicada pelo modelo. O valor de R2 de K dobras varia entre 0% e 100%. (Embora os cálculos para R2 de K dobras possam produzir valores negativos, o Minitab Statistical Software exibe 0 para esses casos).

Fórmula

Em cada dobra, o Minitab calcula a soma de quadrados dos erros. Esses cálculos usam os mesmos termos de modelo para cada dobra, mas as estimativas dos coeficientes podem diferir. Para calcular a estatística R2 de k dobras, a soma as somas de quadrado provenientes das diferentes dobras. Para regressão

e para regressão ponderada

.

Isto feito, fórmula a seguir dá a equação para R2 de k dobras:

Notação

TermoDescrição
número de linhas sem valores faltantes para a resposta ou valores faltantes para os preditores que formam os termos do candidato no modelo
io valor de resposta observado na dobra j
io valor submetido a validação cruzada e ajustado para a resposta na dobra j
Knúmero de dobras
wijpeso para a ia observação na dobra j
SSTotalsoma total dos quadrados para todos os dados

R2 stepwise de K dobras

O R2 stepwise de K dobras avalia o número de termos em um modelo de um conjunto de termos candidatos. Quando ocorrem valores negativos para o R2 stepwise de K dobras, o Minitab os exibe.

Fórmula

O Minitab calcule o R2 stepwise de k dobras quando o método de seleção stepwise é seleção forward com validação e o método de validação é validação cruzada de K dobras. O Minitab realiza a seleção forward K vezes, omitindo os dados para cada dobra uma vez. O modelo para cada dobra pode ser diferente. Depois de concluídos os procedimentos de seleção forward, o Minitab soma os quadrados dos erros para todas as dobras a cada passo. O Minitab usa esta soma para calcular o R2 stepwise de k dobras. Para regressão:

e para regressão ponderada:

A fórmula a seguir fornece o valor de R2 stepwise de k dobras para um passo.

Notação

TermoDescrição
número de linhas sem valores faltantes para a resposta ou valores faltantes para os preditores que formam os termos do candidato no modelo
io valor de resposta observado na dobra j
io valor submetido a validação cruzada e ajustado para a resposta na dobra j
Knúmero de dobras
wijpeso para a ia observação na dobra j
SSTotalsoma total dos quadrados para todos os dados

Log-verossimilhança

Para análises não ponderadas, o Minitab usa a seguinte equação:
Para uma análise que tem pesos para as observações, o Minitab usa a seguinte equação:

As observações com pesos 0 não estão na análise.

Notação

TermoDescrição
no número de observações
Ra soma dos quadrados para erro do modelo
wio peso da ia observação

AICc (Critério de Informação de Akaike Corrigido)

O AICc não é calculado quando .

Notação

TermoDescrição
no número de observações
po número de coeficientes no modelo, incluindo a constante

BIC (Critério de Informação Bayesiano)

Notação

TermoDescrição
po número de coeficientes no modelo, incluindo a constante
no número de observações

Cp de Mallows

Notação

TermoDescrição
SSEpsoma dos quadrados dos erros para o modelo sob consideração
MSEmquadrado médio do erro para o modelo com todos os termos candidatos
nnúmero de observações
pnúmero de termos no modelo incluindo a constante