Interpretar os principais resultados para ANOVA balanceada

Conclua as etapas a seguir para interpretar uma ANOVA balanceada. Os principais resultados incluem o valor de p, médias de grupo, R2 e os gráficos de resíduos.

Etapa1: Determine se a associação entre a resposta e o termo é estatisticamente significativa

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que não há nenhuma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Para esta análise no Minitab, o modelo deve ser hierárquico. Em um modelo hierárquico, todos os termos de ordem inferior que compõem os termos de ordem superior também aparecem no modelo. Por exemplo, um modelo que inclui o termo de interação A*B*C é hierárquico se incluir estes termos: A, B, C, A*B, A*C e B*C.
Se um termo do modelo for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
  • Se um fator fixo é significativo, é possível concluir que nem todas as médias de nível são iguais.
  • Se um fator aleatório é significativo, é possível concluir que o fator contribui para a quantidade de variação na resposta.
  • Se um termo de interação é significativo, a relação entre um fator e a resposta depende dos outros fatores do termo. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação.

Use a tabela Médias para entender as diferenças estatisticamente significativas entre os níveis de fatores em seus dados. A média de cada grupo fornece uma estimativa de cada média da população. Procure por diferenças entre médias de grupo para termos que são estatisticamente significativos.

Para efeitos principais, a tabela apresenta os grupos dentro de cada fator e suas médias. Para efeitos de interação, a tabela apresenta todas as combinações possíveis dos grupos. Se um termo de interação for estatisticamente significativo, não interprete os efeitos principais sem considerar os efeitos da interação.

Informações dos Fatores

FatorTipoNíveisValores
TempoFixo21; 2
OperadorAleatório31; 2; 3
ConfiguraçãoFixo335; 44; 52

Análise de Variância para Espessura

FonteGLSQQMFP
  Tempo19,09,000,290,644 
  Operador21120,9560,444,280,081x
  Configuração215676,47838,1973,180,001 
  Tempo*Operador262,031,004,340,026 
  Tempo*Configuração2114,557,258,020,002 
  Operador*Configuração4428,4107,1115,010,000 
Erro22157,07,14     
Total3517568,2       
x Não é um Teste-F exato.

Sumário do Modelo

SR2R2(aj)
2,6714099,11%98,58%

Termos de erro para testes

FonteComponente
de variância
Termo
de erro
Quadrado Médio Esperado para Cada
Termo (usando o modelo irrestrito)
1Tempo  4(7) + 6 (4) + Q[1; 5]
2Operador35,789*(7) + 4 (6) + 6 (4) + 12 (2)
3Configuração  6(7) + 4 (6) + Q[3; 5]
4Tempo*Operador3,9777(7) + 6 (4)
5Tempo*Configuração  7(7) + Q[5]
6Operador*Configuração24,9947(7) + 4 (6)
7Erro7,136  (7)
* Teste Sintetizado.

Termos de Erro para Testes Sintetizados

FonteGL do ErroQM do ErroSíntese do QM
do Erro
2Operador5,12130,9747(4) + (6) - (7)

Médias

TempoNEspessura
11867,7222
21868,7222
ConfiguraçãoNEspessura
351240,5833
441273,0833
521291,0000
Tempo*ConfiguraçãoNEspessura
1 35640,6667
1 44670,1667
1 52692,3333
2 35640,5000
2 44676,0000
2 52689,6667
Principais resultados: valor de P, tabela Médias

Configuração é um fator fixo e este efeito principal é significativo. Este resultado indica que a espessura de revestimento média não é igual para todas as configurações da máquina.

Tempo*Configuração é um efeito de interação que envolve dois fatores fixos. Este efeito de interação é significativo, o que indica que a relação entre cada fator e a resposta depende do nível do outro fator. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação.

Nestes resultados, a tabela Médias mostra como a espessura média varia de acordo com o tempo, configuração da máquina e cada combinação de tempo e configuração de máquina. A configuração é estatisticamente significativa e as médias diferem entre as configurações de máquina. No entanto, como o termo de interação Tempo*Configuração é estatisticamente significativo, não interprete os efeitos principais sem considerar os efeitos da interação. Por exemplo, a tabela para o termo de interação mostra que com uma configuração de 44, o tempo 2 está associado a um revestimento mais espesso. No entanto, com uma configuração de 52, o tempo 1 está associado a um revestimento mais espesso.

O operador é um fator aleatório e todas as interações que incluem um fator aleatório são consideradas como aleatórias. Se um fator aleatório é significativo, é possível concluir que o fator contribui para a quantidade de variação na resposta. Operador não é significativo ao nível de 0,05, mas os efeitos de interação que incluem operador são significativos. Estes efeitos de interação indicam que a quantidade de variação com que o operador contribui para a resposta depende do valor do tempo e da configuração da máquina.

Etapa 2: Determine se o modelo ajusta bem os dados

Para determinar se o modelo ajusta bem os dados, examine as estatísticas de qualidade do ajuste tabela do resumo do modelo.

S

Use S para avaliar se o modelo descreve bem a resposta. Use S em vez das estatísticas de R2 para comparar o ajuste de modelos que não têm constante.

S é medido nas unidades da variável de resposta e representa o quão longe os valores de dados caem dos valores ajustados. Quanto mais baixo for o valor de S, melhor o modelo descreve a resposta. No entanto, um valor de S baixo por si só não indica que o modelo satisfaz aos pressupostos do modelo. Você deve verificar os gráficos de resíduos para conferir os pressupostos.

R2

Quanto mais alto o valor de R2 melhor o modelo ajusta seus dados. O valor de R2 está sempre entre 0 e 100%.

O R2 sempre aumenta quando você adiciona mais preditores a um modelo. Por exemplo, o melhor modelo de cinco preditores terá sempre um R2 que é pelo menos tão elevado quanto o melhor modelo de quatro preditores. Portanto, R2 é mais útil quando for comparado a modelos do mesmo tamanho.

R2 (aj)

Use o R2 ajustado quando desejar comparar modelos que têm diferentes números de preditores. R2 sempre aumenta quando você adiciona um preditor ao modelo, mesmo quando não existe uma verdadeira melhoria ao modelo. O valor de R2 ajustado incorpora o número de preditores no modelo para ajudá-lo a escolher o modelo correto.

Considere os seguintes pontos ao interpretar os valores de R2:
  • Amostras pequenas não fornecem uma estimativa precisa da força da relação entre a resposta e os preditores. Por exemplo, se você precisar que R2 seja mais exato, deve usar uma amostra maior (geralmente, 40 ou mais).

  • A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um um valor desejável, você deve verificar os gráficos de resíduos para conferir se o modelo atende aos pressupostos do modelo.

Sumário do Modelo

SR2R2(aj)
2,6714099,11%98,58%
Principais resultados: S, R2, R2 (aj)

Nestes resultados, o modelo explica 99,11% da variação da espessura do revestimento. Por estes dados, o valor de R2 indica que o modelo fornece um bom ajuste aos dados. Se os modelos adicionais forem ajustados com diferentes preditores, utilize os valores de R2 ajustados para comparar se os modelos ajustam bem os dados.

Etapa 3: Determinar se o modelo atende às suposições da análise

Use os gráficos de resíduos para ajudar a determinar se o modelo é adequado e satisfaz aos pressupostos da análise. Se os pressupostos não forem satisfeitos, o modelo pode não ajustar bem os dados e você deve ter cautela ao interpretar os resultados.

Para obter mais informações sobre como lidar com os padrões nos gráficos residuais, vá para Gráficos de resíduos para Ajustar modelo linear generalizado e clique no nome do gráfico residual na lista na parte superior da página.

Gráficos de resíduos versus de ajustes

Use o gráfico de resíduos versus ajustes para verificar a pressuposição de que os resíduos são aleatoriamente distribuídos e têm variância constante. De maneira ideal, os pontos devem cair aleatoriamente em ambos os lados de 0, sem padrões reconhecíveis nos pontos.

Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo.
Padrão O que o padrão pode indicar
Dispersão grande ou irregular de resíduos entre valores ajustados Variância não constante
Curvilíneo Um termo de ordem mais alta ausente
Um ponto que está distante de zero Um outlier
Um ponto que é distante dos outros pontos na direção x Um ponto influente
Neste gráfico de resíduos versus valores ajustados, os dados não parecem estar aleatoriamente distribuídos em torno de zero. Não há evidências de que o valor dos resíduos depende do valor ajustado.

Gráfico de resíduos versus ordem

Use o gráfico de resíduos versus ordem para verificar o pressuposto de que os resíduos são independentes um do outro. Resíduos independentes não mostram tendências nem padrões quando exibidos em ordem temporal. Os padrões nos pontos podem indicar que os resíduos próximos uns dos outros podem ser correlacionados e, portanto, não são independentes. De maneira ideal, os resíduos no gráfico devem cair aleatoriamente em torno da linha central:
Se você vir um padrão, investigue a causa. Os seguintes tipos de padrões podem indicar que os resíduos são dependentes.
Tendência
Deslocamento
Ciclo
Neste gráfico de resíduos versus ordem, os resíduos não parecem cair aleatoriamente em torno da linha central. Não há evidências de que os resíduos não são independentes.

Gráfico de probabilidade normal

Use o gráfico de probabilidade normal de resíduos para verificar a pressuposição de que os resíduos são distribuídos normalmente. O gráfico de probabilidade normal dos resíduos deve seguir aproximadamente uma linha reta.

Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo.
Padrão O que o padrão pode indicar
Não é uma linha reta Não normalidade
Um ponto que está distante da linha Um outlier
Alteração de inclinação Uma variável não identificada
Neste gráfico de probabilidade normal, os pontos, em geral, seguem uma linha reta. Não há nenhuma evidência de não normalidade, outliers ou variáveis não identificadas.