Considerações de dados para Ajustar modelo linear generalizado

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise, e interpretar os resultados.

Os dados devem incluir pelo menos um fator categórico

Os fatores categóricos podem ser fatores cruzados, aninhados, fixos e aleatórios.

  • Para um modelo com fatores aleatórios, normalmente utiliza-se Ajustar modelo de efeitos mistos de modo que você pode usar o método de estimativa de Máxima Verossimilhança Restrita (REML).
  • Se você tiver um fator categórico e não houver preditores contínuos, também é possível usar ANOVA com 1 fator.
  • Se você tiver variáveis preditoras principalmente contínuas, é possível obter resultados semelhantes com o modelo Ajuste do modelo de regressão.
  • Se você tem um ou dois fatores categóricos e quer comparar as médias de nível com a média global dos dados que seguem distribuições normais, binomiais ou de Poisson, use Análise de médias.
  • Se você quiser testar a igualdade dos desvios padrão entre os grupos, use Teste de igualdade de variâncias.

Para obter mais informações sobre fatores, vá para Fatores e níveis de fatores, O que são fatores, fatores cruzados e fatores aninhados? e Qual é a diferença entre fatores fixos e aleatórios?.

A variável de resposta deve ser contínua
Se a variável resposta for categórica, é menos provável que seu modelo atenda às premissas da análise para descrever com precisão os seus dados ou para fazer predições úteis.
  • Se você tiver várias variáveis de resposta que estão correlacionadas e um conjunto comum de fatores, use MANOVA generalizada, que tem mais poder e pode detectar padrões de resposta multivariados.
  • Se a sua variável de resposta tiver duas categorias, como aprovação e reprovação, use Ajustar modelo logístico binário.
  • Se a variável de resposta contiver três ou mais categorias que têm uma ordem natural, como discorda, discorda, neutro, concorda e concorda plenamente, use Regressão logística ordinal.
  • Se a variável de resposta contém três ou mais categorias que não têm uma ordem natural, como arranhão, dente e rasgo, use Regressão logística nominal.
  • Se a sua variável de resposta conta ocorrências, como o número de defeitos, use Ajustar modelo de Poisson.
Cada observação deve ser independente de todas as outras observações
Se suas observações são dependentes, seus resultados podem não ser válidos. Considere os seguintes pontos para determinar se suas observações são independentes:
  • Se uma observação não fornece informações sobre o valor de outra observação, as observações são independentes.
  • Se uma observação fornece informações sobre o valor de outra observação, as observações são dependentes.
Os dados da amostra devem ser selecionados aleatoriamente

As amostras aleatórias são usadas para fazer generalizações, ou inferências, sobre uma população. Se seus dados não foram coletados aleatoriamente, seus resultados podem não representar a população.

Coleta de dados usando as práticas recomendadas
Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes:
  • Certifique-se de que os dados representem a população de interesse.
  • Colete dados suficientes para proporcionar a precisão necessária.
  • Meça as variáveis com o máximo rigor e precisão possível.
  • Registro os dados na ordem em que são coletados.
A correlação entre os preditores, também conhecida como multicolinearidade, não deve ser grave

Se multicolinearidade for grave, você pode não ser capaz de determinar qual dos preditores deve ser incluído no modelo. Para determinar a gravidade da multicolinearidade, utilize os fatores de inflação da variância (VIF) na tabela de coeficientes da saída.

O modelo deve fornecer um bom ajuste aos dados

Se o modelo não se ajustar aos dados, os resultados podem ser equivocados. Na saída, utilize os gráficos residuais, as estatísticas de diagnóstico para observações incomuns e as estatísticas de resumo modelo para determinar o quão bem o modelo se ajusta aos dados.