O que é a regressão parcial de mínimos quadrados?

Regressão parcial de mínimos quadrados (PLS) é uma técnica que reduz os preditores a um conjunto menor de componentes não correlacionados e efetua regressão de mínimos quadrados para esses componentes no lugar dos dados originais. A regressão PLS é particularmente útil quando os preditores são altamente colineares ou quando existem mais preditores do que observações e a regressão de mínimos quadrados ordinários gera coeficientes com erros padrão altos ou que falha totalmente. A PLS não assume que os preditores são fixos, ao contrário da regressão múltipla. Isto significa que os preditores podem ser medidos com erro, tornando a PLS mais robusta à incerteza da medição.

A regressão PLS é usada primariamente nos setores químico, farmacêutico, alimentício e plástico. Um aplicação comum consiste em modelar a relação entre medidas espectrais (NIR, IR e UV), que incluem muitas variáveis frequentemente correlacionadas entre si, e composição química ou outras propriedades físico-químicas. Na regressão PLS, a ênfase está em desenvolver modelos preditivos. Por isso ela não é muito usada para filtrar variáveis que não sejam úteis para explicar a resposta.

Para executar uma PLS, o Minitab usa o algoritmo de mínimos quadrados parciais iterativos não-lineares (NIPALS) desenvolvido por Herman WoldH. O algoritmo reduz o número de preditores usando uma técnica semelhante à análise de componentes principais para extrair um conjunto de componentes que descreve a correlação máxima entre os preditores e as variáveis de resposta. A PLS pode calcular tantos componentes quanto o número de preditores; frequentemente, usa-se a validação cruzada para identificar o conjunto menor de componentes que fornecem a maior capacidade preditiva. Se você calcular todos os componentes possíveis, o modelo resultante é equivalente ao modelo que você obteria usando regressão por mínimos quadrados. Na PLS, os componentes são selecionados com base na quantidade de variância que eles explicam nos preditores e entre os preditores e a(s) resposta(s). Se os preditores forem altamente correlacionados, ou se um número menor de componentes modela perfeitamente a resposta, o número de componentes no modelo da PLS pode ser muito menor do que o número de preditores. O Minitab executa a regressão de mínimos quadrados nestes componentes não correlacionados.

Ao contrário da regressão de mínimos quadrados, a PLS pode ajustar as múltiplas variáveis ​​de resposta em um único modelo. A regressão PLS ajusta as múltiplas variáveis ​​de resposta em um único modelo. Como a regressão PLS modela as variáveis ​​de resposta de forma multivariada, os resultados podem diferir significativamente daqueles calculados para as variáveis ​​de resposta individual. Você deve modelar várias respostas separadamente somente se as respostas não estiverem correlacionadas.