Interpretar os principais resultados para Ajustar modelo de efeitos mistos

Conclua as etapas a seguir para interpretar um modelo de efeitos mistos.

Etapa 1: Determine se os termos aleatórios afetam significativamente a resposta

Para determinar se um termo aleatório afeta significativamente a resposta, compare o valor-p do termo na tabela Componentes da Variância com o seu nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe um efeito, quando, na verdade, não existe nenhum efeito, é de 5%.
Valor-p ≤ α: O termo aleatório afeta significativamente a resposta
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que o termo aleatório afeta significativamente a resposta. Isto significa que a variância do termo aleatório é significativamente diferente de zero.
Valor-p > α: O termo aleatório não afeta significativamente a resposta
Se o valor-p for maior que o nível de significância, não é possível concluir que o termo aleatório afeta significativamente a resposta. Talvez seja desejável reajustar o modelo sem o termo não significativo para avaliar o efeito do termo em outros resultados.

Componentes de Variância

FonteVar% do TotalEP de VarValor-ZValor-P
Campo0,07791972,93%0,0675801,1529960,124
Erro0,02892427,07%0,0105622,7386130,003
Total0,106843       
-2 Log-verossimilhança = 7,736012
Principais resultados: valor-p

Nestes resultados, o campo é o termo aleatório e o valor-p para o campo é 0,124. Como esse valor é maior do que 0,05, não há evidências suficientes para concluir que os diferentes campos contribuem para a quantidade de variação no rendimento.

Etapa 1: Determine se os termos de efeitos fixos afetam significativamente a resposta

Para determinar se um termo afeta significativamente a resposta, compare o valor-p com seu nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe um efeito, quando, na verdade, não existe nenhum efeito, é de 5%.

A interpretação de cada valor-p depende se ele é destinado ao coeficiente de um fator fixo ou a um termo covariável:

Termo de fator fixo

Para um termo de fator fixo, a hipótese nula é que o termo de fator fixo não afeta significativamente a resposta.
Valor-p ≤ α: O termo de fator fixo afeta significativamente a resposta

Se o valor-p for menor ou igual ao nível de significância, é possível concluir que o termo de fator fixo afeta significativamente a resposta. A rejeição da hipótese nula significa um efeito de nível que é significativamente diferente dos outros efeitos a nível do termo.

Valor-p > α: O termo de fator fixo não afeta significativamente a resposta
Se o valor-p for maior que o nível de significância, não é possível concluir que o termo de fator fixo afeta significativamente a resposta. Talvez seja necessário reajustar o modelo sem o termo.

Termos covariável

Para um termo de covariável, a hipótese nula é que não existe nenhuma associação entre o termo e a resposta.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo da covariável.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a resposta e o termo da covariável. Talvez seja necessário reajustar o modelo sem o termo de covariável.

Testes de Efeitos Fixos

TermoNum GLDen GLValor FValor-P
Variedade5,0015,0026,290,000
Principais resultados: Valores-p

Variedade é o termo de fator fixo, e o valor-p para o termo de variedade é menor do que 0,000. Como este valor é inferior a 0,05, é possível concluir que as médias de nível não são todas iguais, ou seja, a variedade de alfafa tem um efeito sobre o rendimento.

Para obter uma melhor compreensão dos efeitos principais, acesse Gráficos Fatoriais.

Etapa 3: Determinar quão bem o modelo se ajusta aos seus dados

Para determinar se o modelo ajusta bem os dados, examine as estatísticas de qualidade do ajuste tabela do resumo do modelo.

S

S é o desvio padrão estimado do termo de erro. Quanto menor é o valor de S, melhor a equação ajustada condicional descreve a resposta nas configurações de fatores selecionadas. No entanto, um valor de S por si, não descreve completamente a adequação do modelo. Analise também os principais resultados de outras tabelas e os gráficos de resíduos.

R2

R2 representa a porcentagem de variação na resposta que é explicada pelo modelo. Ele é calculado como 1 menos a razão da soma dos quadrados dos erros (que é a variação que não é explicada pelo modelo) para a soma total dos quadrados (que é a variação total no modelo).

R2 (aj)

Use o R2 ajustado quando quiser comparar modelos com a mesma estrutura de covariância, mas tiver um número diferente de fatores fixos e covariáveis. Assumindo-se que os modelos tenham a mesma estrutura de covariância, R2 aumenta quando você adiciona mais fatores fixos versus covariáveis. O valor de R2 ajustado incorpora o número de fatores fixos e covariáveis no modelo para ajudá-lo a escolher o modelo correto.

AICc e BIC
Quando você mostra os resultados expandidos da análise, o Minitab mostra mais duas estatísticas. Essas estatísticas são o Critério de Informação de Akaike Corrigido (AICc) e o Critério de Informação Bayesiano (BIC). Use essas estatísticas para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis.
Considere os seguintes pontos quando interpretar as estatísticas de qualidade de ajuste:
  • Para obter estimativas mais precisas e com menos vício para os parâmetros em um modelo, em geral, o número de linhas de um conjunto de dados deve ser muito maior do que o número de parâmetros do modelo. Para obter estimativas razoavelmente boas para os componentes de variância dos termos aleatórios, você deve ter níveis que sejam representativos o suficiente para cada fator aleatório.

  • A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um um valor desejável, você deve verificar os gráficos de resíduos para conferir se o modelo atende aos pressupostos do modelo.

Sumário do Modelo

SR2R2(aj)AICcBIC
0,17007192,33%90,20%12,5413,52
Principais resultados: S, R2, R2 (aj)

Nestes resultados, o desvio padrão estimado (S) do termo de erro aleatório é 0,17. O modelo explica 92,33% da variação no rendimento dos pés de alfafa. Depois de ajustar para o número de parâmetros de fator fixo no modelo, a porcentagem diminui para 90,2%.

Etapa 4: Avalie como cada nível de um termo efeito fixo afeta a resposta

Se o valor-p indica que um termo é significativo, você pode examinar os coeficientes para o termo para entender como o termo refere-se à resposta. A interpretação de cada valor-p depende se ele é destinado ao coeficiente de um fator fixo ou a um termo covariável:

Os coeficientes para um termo de fator fixo apresentam como as médias de nível para o termo são diferentes. Também é possível realizar uma análise de comparações múltiplas para o termo a fim de classificar em mais detalhes os efeitos de nível em grupos que sejam estatisticamente iguais ou estatisticamente diferentes.

O coeficiente de um termo covariável representa a alteração na resposta média associada a uma mudança de 1 unidade naquele termo, enquanto todo o resto no modelo permanece igual. O sinal do coeficiente indica a direção da relação entre o termo e a resposta. O tamanho do coeficiente geralmente oferece uma boa maneira de avaliar a significância prática do efeito do termo sobre a variável de resposta.

Coeficientes

TermoCoefEP de CoefGLValor-TValor-P
Constante3,0945830,1438223,0021,5166920,000
Variedade         
  10,3854170,07762615,004,9650160,000
  20,1454170,07762615,001,8732870,081
  30,1079170,07762615,001,3902050,185
  4-0,3195830,07762615,00-4,1169380,001
  50,3954170,07762615,005,0938380,000
Principais resultados: Coeficientes

Das seis variedades de alfafa no experimento, a saída mostra os coeficientes de cinco tipos. Por padrão, o Minitab remove um nível de fator para evitar a multicolinearidade perfeita. Os coeficientes para os efeitos principais representam a diferença entre cada nível médio e a média geral. Por exemplo, Variedade 1 está associada com um rendimento de alfafa que é de aproximadamente 0,385 unidades maior do que a média global.

Etapa 5: Determinar se o modelo atende às suposições da análise

Use os gráficos de resíduos para ajudar a determinar se o modelo é adequado e satisfaz aos pressupostos da análise. Se os pressupostos não forem satisfeitos, o modelo pode não ajustar bem os dados e você deve ter cautela ao interpretar os resultados.

Observação

Você pode representar graficamente resíduos marginais e condicionais. Um resíduo marginal é igual à diferença entre um valor de resposta observado e a resposta média estimada correspondente sem condicionamento sobre os níveis dos fatores aleatórios. Em contrapartida, dados os níveis específicos de fatores aleatórios, um resíduo condicional é igual à diferença entre um valor de resposta observado e a resposta média condicional correspondente. Use os resíduos condicionais para verificar a normalidade do termo de erro no modelo.

Gráficos de resíduos versus de ajustes

O gráfico de resíduos versus ajustes representa graficamente os resíduos no eixo Y e os valores ajustados no eixo X. Utilize este gráfico para identificar linhas de dados com resíduos muito maiores do que outras linhas. Além disso, investigue essas linhas para saber se elas foram coletadas corretamente. Ademais, você também pode usar este gráfico para observar padrões específicos nos resíduos que podem indicar outras variáveis a serem consideradas.

Gráfico de resíduos versus ordem

O gráfico de resíduos versus ordem mostra os resíduos na ordem em que os dados foram coletados. Utilize este gráfico para identificar linhas de dados com resíduos muito maiores do que outras linhas. Além disso, investigue essas linhas para saber se elas foram coletadas corretamente. Se o gráfico exibir um padrão em ordem de tempo, você pode tentar incluir um termo dependente de tempo no modelo para remover o padrão.