Métodos para Regressão de mínimos quadrados parciais

Selecione o método de sua escolha.

Ajuste de modelo

O Minitab usa o algoritmo de mínimos quadrados parciais iterativos não-lineares (NIPALS) desenvolvido por Herman Wold1 para solucionar problemas associados a dados mal condicionados. O PLS reduz o número de preditoras extraindo componentes não-relacionados com base na covariância entre a preditora e as variáveis de resposta. O PLS é similar à regressão dos principais componentes e da regressão de ridge, mas varia em seu método computacional.

O algoritmo do PLS produz uma sequência de modelos, onde cada modelo consecutivo contém um componente adicional. Os componentes são calculados um de cada vez, iniciando com a matriz x- e y- padronizadas. Os componentes subsequentes são calculados a partir da matriz residual X- e y-, as iterações param ao alcançar o número máximo de componentes ou quando os resíduos x- tornam-se a matriz zero. Se o número de componentes for igual ao número de preditoras, o modelo PLS é igual ao modelo de regressão de mínimos quadrados. A validação cruzada é usada para identificar o número de componentes que minimiza o erro da predição.

O PLS realiza a decomposição em ambas, preditoras e respostas simultaneamente. Após o Minitab determinar o número de componentes e calcular as cargas fatoriais, ele calcula os coeficientes de regressão para cada preditora. Para obter informações mais detalhadas sobre PLS e NIPALS consulte 234.

Validação cruzada

Calcula a capacidade preditiva dos modelos potenciais para ajudá-lo a determinar o número apropriado de componentes para reter em seu modelo. Quando os dados contêm variáveis de resposta múltipla. O Minitab valida os componentes para todas as respostas simultaneamente.

Procedimento de validação cruzada

Para cada modelo potencial, o Minitab:

  1. Omite uma observação ou grupo de observações, dependendo do método de validação cruzada que você usa.
  2. Recalcula o modelo sem a observação/grupos de observações.
  3. Prediz a resposta ou o valor ajustado da validação cruzada para a observação/grupo de observações omitido usando-se o modelo recalculado e calcula o valor residual da validação cruzada.
  4. Repete as etapas de 1 a 3 até que todas as observações tenham sido omitidas e ajustadas.
  5. Calcula a soma de quadrados predita (PRESS) e os valores R2 preditos.

Após efetuar as etapas de 1 a 5 para cada modelo, o Minitab seleciona o modelo com o número de componentes que produz o R2 mais alto predito e o menor PRESS. Com variáveis de resposta múltipla, o Minitab seleciona o modelo com o maior R2 médio predito e o menor PRESS médio.

1 H. Wold (1975). "Soft Modeling by Latent Variables; the Nonlinear Iterative Partial Least Squares Approach," in Perspectives in Probability and Statistics, Papers in Honour of M.S. Bartlett, ed. J. Gani, Academic Press.
2 P. Geladi and B. Kowalski (1986). "Partial Least-Squares Regression: A Tutorial," Analytica Chimica Acta, 185, 1-17.
3 A. Hoskuldsson (1988). "PLS Regression Methods," Journal of Chemometrics, 2, 211-228.
4 A. Lorber, L. Wangen, and B. Kowalski (1987). "A Theoretical Foundation for the PLS Algorithm," Journal of Chemometrics, 1, 19-31.