Considerações de dados para Regressão não-linear

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise, e interpretar os resultados.

Os preditores podem ser contínuos ou categóricos

A variável contínua pode ser medida e ordenada, e tem um número infinito de valores entre dois valores quaisquer. Por exemplo, os diâmetros de uma amostra de pneus representam uma variável contínua.

As variáveis categóricas contêm um número finito, contável de categorias ou grupos distintos. Os dados categóricos podem não ter uma ordem lógica. Por exemplo, os preditores categóricos incluem gênero, tipo de material e método de pagamento.

Se você tem uma variável discreta, pode decidir se quer tratá-la como um preditor contínuo ou categórico. Uma variável discreta pode ser medida e ordenada mas tem um número contável de valores. Por exemplo, o número de pessoas que vivem em uma casa é uma variável discreta. A decisão de se tratar de uma variável contínua ou discreta como categórica depende do número de níveis, bem como da finalidade da análise.

Se você tiver algum preditor categórico, converta os preditores categóricos para variáveis indicadoras antes de realizar esta análise. Para converter os preditores categóricos, use Criação de Variáveis Indicadoras.

A variável de resposta deve ser contínua

Se a variável resposta for categórica, é menos provável que seu modelo atenda às premissas da análise para descrever com precisão os seus dados ou para fazer predições úteis.

Se seus dados não requerem uma função linear, você poderá considerar as seguintes análises alternativas.

  • Se a sua variável de resposta tiver duas categorias, como aprovação e reprovação, use Ajustar modelo logístico binário.
  • Se a variável de resposta contiver três ou mais categorias que têm uma ordem natural, como discorda, discorda, neutro, concorda e concorda plenamente, use Regressão logística ordinal.
  • Se a variável de resposta contém três ou mais categorias que não têm uma ordem natural, como arranhão, dente e rasgo, use Regressão logística nominal.
  • Se a sua variável de resposta conta ocorrências, como o número de defeitos, use Ajustar modelo de Poisson.
A função de expectativa deve descrever com precisão a relação entre as variáveis de resposta e do preditor
Sua escolha pela função de expectativa depende, por vezes, do conhecimento prévio sobre o formato da curva da resposta ou do comportamento das propriedades físico-químicas do sistema. As formas não lineares potenciais incluem côncavo, convexo, crescimento exponencial ou decadência, sigmoidal (S) e curvas assintóticas. É necessário especificar a função que satisfaça a ambas as exigências de seu conhecimento prévio e aos gráficos residuais.
Você deve especificar valores iniciais aceitáveis
Um algoritmo iterativo estima parâmetros ajustando sistematicamente as estimativas dos parâmetros para reduzir a soma dos quadrados dos erros (SSE). Para algumas funções de expectativa e conjuntos de dados, os valores iniciais podem afetar significativamente os resultados.
Coleta de dados usando as práticas recomendadas
Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes:
  • Certifique-se de que os dados representem a população de interesse.
  • Colete dados suficientes para proporcionar a precisão necessária.
  • Meça as variáveis com o máximo rigor e precisão possível.
  • Registro os dados na ordem em que são coletados.
O modelo deve fornecer um bom ajuste aos dados

Se o modelo não se ajustar aos dados, os resultados podem ser equivocados. Na saída, use gráficos de resíduos e estatísticas de resumo do modelo para determinar o quão bem o modelo se ajusta aos dados.