Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise, e interpretar os resultados.
- Os dados devem incluir pelo menos um fator categórico
-
Os fatores categóricos podem ser fatores cruzados, aninhados, fixos e aleatórios.
- Para um modelo com fatores aleatórios, normalmente utiliza-se Ajustar modelo de efeitos
mistos de modo que você pode usar o método de estimativa de Máxima Verossimilhança Restrita (REML).
- Se você tiver um fator categórico e não houver preditores contínuos, também é possível usar ANOVA com 1
fator.
- Se você tiver variáveis preditoras principalmente contínuas, é possível obter resultados semelhantes com o modelo Ajuste do modelo de
regressão.
- Se você tem um ou dois fatores categóricos e quer comparar as médias de nível com a média global dos dados que seguem distribuições normais, binomiais ou de Poisson, use Análise de
médias.
- Se você quiser testar a igualdade dos desvios padrão entre os grupos, use Teste de igualdade de
variâncias.
Para obter mais informações sobre fatores, vá para Fatores e níveis de fatores, O que são fatores, fatores cruzados e fatores aninhados? e Qual é a diferença entre fatores fixos e aleatórios?.
- A variável de resposta deve ser contínua
- Se a variável resposta for categórica, é menos provável que seu modelo atenda às premissas da análise para descrever com precisão os seus dados ou para fazer predições úteis.
- Se você tiver várias variáveis de resposta que estão correlacionadas e um conjunto comum de fatores, use MANOVA
generalizada, que tem mais poder e pode detectar padrões de resposta multivariados.
- Se a sua variável de resposta tiver duas categorias, como aprovação e reprovação, use Ajustar modelo
logístico binário.
- Se a variável de resposta contiver três ou mais categorias que têm uma ordem natural, como discorda, discorda, neutro, concorda e concorda plenamente, use Regressão logística
ordinal.
- Se a variável de resposta contém três ou mais categorias que não têm uma ordem natural, como arranhão, dente e rasgo, use Regressão logística
nominal.
- Se a sua variável de resposta conta ocorrências, como o número de defeitos, use Ajustar modelo de
Poisson.
- Cada observação deve ser independente de todas as outras observações
-
Se suas observações são dependentes, seus resultados podem não ser válidos. Considere os seguintes pontos para determinar se suas observações são independentes:
- Se uma observação não fornece informações sobre o valor de outra observação, as observações são independentes.
- Se uma observação fornece informações sobre o valor de outra observação, as observações são dependentes.
- Os dados da amostra devem ser selecionados aleatoriamente
-
As amostras aleatórias são usadas para fazer generalizações, ou inferências, sobre uma população. Se seus dados não foram coletados aleatoriamente, seus resultados podem não representar a população.
- Coleta de dados usando as práticas recomendadas
-
Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes:
- Certifique-se de que os dados representem a população de interesse.
- Colete dados suficientes para proporcionar a precisão necessária.
- Meça as variáveis com o máximo rigor e precisão possível.
- Registro os dados na ordem em que são coletados.
- A correlação entre os preditores, também conhecida como multicolinearidade, não deve ser grave
-
Se multicolinearidade for grave, você pode não ser capaz de determinar qual dos preditores deve ser incluído no modelo. Para determinar a gravidade da multicolinearidade, utilize os fatores de inflação da variância (VIF) na tabela de coeficientes da saída.
- O modelo deve fornecer um bom ajuste aos dados
-
Se o modelo não se ajustar aos dados, os resultados podem ser equivocados. Na saída, utilize os gráficos residuais, as estatísticas de diagnóstico para observações incomuns e as estatísticas de resumo modelo para determinar o quão bem o modelo se ajusta aos dados.