O que é a regressão parcial de mínimos quadrados?

Regressão parcial de mínimos quadrados (PLS) é uma técnica que reduz os preditores a um conjunto menor de componentes não correlacionados e efetua regressão de mínimos quadrados para esses componentes no lugar dos dados originais. A regressão PLS é particularmente útil quando os preditores são altamente colineares ou quando existem mais preditores do que observações e a regressão de mínimos quadrados ordinários gera coeficientes com erros padrão altos ou que falha totalmente. A PLS não assume que os preditores são fixos, ao contrário da regressão múltipla. Isto significa que os preditores podem ser medidos com erro, tornando a PLS mais robusta à incerteza da medição.

A regressão PLS é usada primariamente nos setores químico, farmacêutico, alimentício e plástico. Um aplicação comum consiste em modelar a relação entre medidas espectrais (NIR, IR e UV), que incluem muitas variáveis frequentemente correlacionadas entre si, e composição química ou outras propriedades físico-químicas. Na regressão PLS, a ênfase está em desenvolver modelos preditivos. Por isso ela não é muito usada para filtrar variáveis que não sejam úteis para explicar a resposta.

Para executar uma PLS, o Minitab usa o algoritmo de mínimos quadrados parciais iterativos não-lineares (NIPALS) desenvolvido por Herman WoldH. O algoritmo reduz o número de preditores usando uma técnica semelhante à análise de componentes principais para extrair um conjunto de componentes que descreve a correlação máxima entre os preditores e as variáveis de resposta. A PLS pode calcular tantos componentes quanto o número de preditores; frequentemente, usa-se a validação cruzada para identificar o conjunto menor de componentes que fornecem a maior capacidade preditiva. Se você calcular todos os componentes possíveis, o modelo resultante é equivalente ao modelo que você obteria usando regressão por mínimos quadrados. Na PLS, os componentes são selecionados com base na quantidade de variância que eles explicam nos preditores e entre os preditores e a(s) resposta(s). Se os preditores forem altamente correlacionados, ou se um número menor de componentes modela perfeitamente a resposta, o número de componentes no modelo da PLS pode ser muito menor do que o número de preditores. O Minitab executa a regressão de mínimos quadrados nestes componentes não correlacionados.

Ao contrário da regressão de mínimos quadrados, a PLS pode ajustar as múltiplas variáveis de resposta em um único modelo. A regressão PLS ajusta as múltiplas variáveis de resposta em um único modelo. Como a regressão PLS modela as variáveis de resposta de forma multivariada, os resultados podem diferir significativamente daqueles calculados para as variáveis de resposta individual. Você deve modelar várias respostas separadamente somente se as respostas não estiverem correlacionadas.