Métodos e fórmulas para Regressão dos melhores subconjuntos

Rotina computacional

Na regressão dos melhores subconjuntos, o Minitab usa um procedimento chamado Caminhada Hamiltoniana que é um método para calcular todos os subconjuntos das preditoras, um subconjunto por etapa. Isto é, o Minitab calcula todos os subconjuntos 2**m - 1 nos passos 2**m - 1, onde m é o número de preditoras no modelo. O Minitab avalia uma regressão de subconjunto em cada etapa.

Casa subconjunto na Caminhada Hamiltoniana difere do subconjunto anterior pela adição ou deleção de somente uma variável. O operador de varredura "varre" uma variável em ou fora da regressão em cada etapa da Caminhada Hamiltoniana, e calcula o R2 para cada subconjunto.

Equação de regressão

Para um modelo com múltiplos preditores, a equação é:

y = β0 + β1x1 + … + βkxk + ε

A equação ajustada é:

Na regressão linear simples, que inclui somente um preditor, o modelo é:

y=ß0+ ß1x1+ε

Usando estimativas de regressão b0 para ß0 e b1 para ß1, a equação ajustada é:

Notação

TermoDescrição
yresposta
xkko termo. Cada termo pode ser um único preditor, um termo polinomial ou um termo de interação.
ßkko coeficiente de regressão da população
εtermo de erro que segue uma distribuição normal com uma média de 0
bkestimativa do ko coeficiente de regressão da população
resposta ajustada

R2

R2 também é conhecido como o coeficiente de determinação.

Fórmula

Notação

TermoDescrição
yi i o valor de resposta observada
resposta média
i a resposta ajustada

R2 (aj)

Notação

TermoDescrição
MSQuadrado Médio
SSSoma dos Quadrados
DFGraus de liberdade

PRESS

Avalia a capacidade preditiva do seu modelo e é calculado como:

Notação

TermoDescrição
nnúmero de observações
eiiésimo residual
hi

iésimo elemento diagonal de

X (X' X)-1X'

R2 (pred)

Enquanto os cálculos para R2(pred) podem produzir valores negativos, o Minitab exibe zero para estes casos.

Notação

TermoDescrição
yi i o valor de resposta observada
resposta média
n número de observações
ei i o resíduo
hi i o elemento diagonal de X(X'X)–1X'
X matriz do experimento

Cp de Mallows

Notação

TermoDescrição
SSEpsoma dos quadrados dos erros para o modelo sob consideração
MSEmquadrado médio do erro para o modelo com todos os termos candidatos
nnúmero de observações
pnúmero de termos no modelo incluindo a constante

S

Notação

TermoDescrição
MSEquadrado médio do erro

Log-verossimilhança

Para análises não ponderadas, o Minitab usa a seguinte equação:
Para uma análise que tem pesos para as observações, o Minitab usa a seguinte equação:

As observações com pesos 0 não estão na análise.

Notação

TermoDescrição
no número de observações
Ra soma dos quadrados para erro do modelo
wio peso da ia observação

AICc (Critério de Informação de Akaike Corrigido)

O AICc não é calculado quando .

Notação

TermoDescrição
no número de observações
po número de coeficientes no modelo, incluindo a constante

BIC (Critério de Informação Bayesiano)

Notação

TermoDescrição
po número de coeficientes no modelo, incluindo a constante
no número de observações

Número de condição

Notação

TermoDescrição
Co número de condição
λmáximoo autovalor máximo da matriz de correlação dos termos no modelo, não incluindo o intercepto
λmínimoo autovalor mínimo da matriz de correlação dos termos no modelo, não incluindo o intercepto