Métodos e fórmulas para a seleção do modelo em Regressão de mínimos quadrados parciais

Selecione o método ou a fórmula de sua escolha.

R2

R2 também é conhecido como o coeficiente de determinação.

Fórmula

Notação

TermoDescrição
yi i o valor de resposta observada
resposta média
i a resposta ajustada

SQ

A soma das distâncias quadradas. A regressão de SQ é a parte da variação explicada pelo modelo. O Erro da SQ é a parte não explicada pelo modelo e é atribuída ao erro. O Total da SQ é a variação total nos dados.

Fórmula

Regressão da SQ:
Erro da SQ:
Total da SQ:

Notação

TermoDescrição
yiiésimo valor de resposta observado
iésima resposta ajustada
resposta média

PRESS

A estatística de predição de soma dos quadrados (PRESS) avalia a capacidade preditiva do seu modelo. PRESS, similar à soma dos quadrados dos resíduos, é a soma dos quadrados do erro de predição. No PLS, o Minitab só calcula o PRESS se você tiver feito a validação cruzada do modelo.

O Minitab calcula o PRESS nas seguintes etapas:

  1. O Minitab recalcula o modelo tantas vezes quanto houver observações, omitindo uma observação diferente cada vez. Para cada observação omitida, o Minitab calcula a resposta ajustada ou predita usando o modelo.
  2. O Minitab subtrai o valor predito do valor da resposta observada. Este é o verdadeiro erro de predição porque o ajuste da observação é independente do modelo.
  3. Quando o Minitab conduz esta rotina para todas as observações, o Minitab calcula o PRESS usando a fórmula:

Em geral, quanto menor o valor do PRESS, melhor a capacidade preditiva do modelo. O PRESS é usado para calcular o R2 predito.

Notação

TermoDescrição
yia resposta observada
a resposta ajustada da observação omitida
no número de observações

R2 (pred)

Enquanto os cálculos para R2(pred) podem produzir valores negativos, o Minitab exibe zero para estes casos.

Notação

TermoDescrição
yi i o valor de resposta observada
resposta média
n número de observações
ei i o resíduo
hi i o elemento diagonal de X(X'X)–1X'
X matriz do experimento

R2 do teste

Indica quão bem o modelo PLS prediz os seus dados de teste. O R2 do teste representa a proporção da variação nas respostas que são explicados pelas preditoras em seu conjunto de dados de teste. Geralmente, os dados de teste são usados para validar o modelo ajustado e devem incluir o mesmo número de preditora que o conjunto de dados originais. O R2 do teste só pode ser calculado se os dados de teste incluírem dados de resposta de cada observação. O R2 do teste é calculado da mesma maneira que o R2 com sua fórmula: