Considerações de dados para Regressão de mínimos quadrados parciais

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise, e interpretar os resultados.

As preditoras não precisam ser corrigidas
Os PLS não assumem que as preditoras sejam corrigidas, o que significa que as preditoras podem ser medidos com erro. Se os preditores forem fixos e não tiverem um erro de medição considerável, o uso Ajuste do modelo de regressão.
Os dados podem ter mais termos do que observações ou os preditores pode ser altamente colineares
Se os preditores não forem altamente colineares e os seus dados incluírem mais observações do que o número de preditores, use Ajuste do modelo de regressão.
Os preditores podem ser contínuos ou categóricos

A variável contínua pode ser medida e ordenada, e tem um número infinito de valores entre dois valores quaisquer. Por exemplo, os diâmetros de uma amostra de pneus representam uma variável contínua.

As variáveis categóricas contêm um número finito, contável de categorias ou grupos distintos. Os dados categóricos podem não ter uma ordem lógica. Por exemplo, os preditores categóricos incluem gênero, tipo de material e método de pagamento.

Se você tem uma variável discreta, pode decidir se quer tratá-la como um preditor contínuo ou categórico. Uma variável discreta pode ser medida e ordenada mas tem um número contável de valores. Por exemplo, o número de pessoas que vivem em uma casa é uma variável discreta. A decisão de se tratar de uma variável contínua ou discreta como categórica depende do número de níveis, bem como da finalidade da análise. Para obter mais informações, acesse O que são variáveis categóricas, discretas e contínuas?.

As variáveis de resposta devem ser contínuas

Se você realizar a análise com as variáveis resposta correlacionadas, o PLS pode detectar padrões de resposta multivariados e relacionamentos mais fracos do que são possíveis com uma análise separada para cada resposta.

Se a variável resposta for categórica, é menos provável que seu modelo atenda às premissas da análise para descrever com precisão os seus dados ou para fazer predições úteis.

Se suas preditoras não estiverem altamente correlacionadas e você não tiver mais preditoras do que observações, poderá considerar as seguintes análises alternativas.

  • Se a sua variável de resposta tiver duas categorias, como aprovação e reprovação, use Ajustar modelo logístico binário.
  • Se a variável de resposta contiver três ou mais categorias que têm uma ordem natural, como discorda, discorda, neutro, concorda e concorda plenamente, use Regressão logística ordinal.
  • Se a variável de resposta contém três ou mais categorias que não têm uma ordem natural, como arranhão, dente e rasgo, use Regressão logística nominal.
  • Se a sua variável de resposta conta ocorrências, como o número de defeitos, use Ajustar modelo de Poisson.
Coleta de dados usando as práticas recomendadas
Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes:
  • Certifique-se de que os dados representem a população de interesse.
  • Colete dados suficientes para proporcionar a precisão necessária.
  • Meça as variáveis com o máximo rigor e precisão possível.
  • Registro os dados na ordem em que são coletados.
O modelo deve fornecer um bom ajuste aos dados

Se o modelo não se ajustar aos dados, os resultados podem ser equivocados. Na saída, use os gráficos de resíduos, a seleção de modelo e estatística de validação, e o gráfico de resposta para determinar o quão bem o modelo se ajusta aos dados.