Interpretar os principais resultados para Análise de experimento fatorial

Conclua as estapas a seguir para analisar um experimento fatorial. Os principais resultados incluem o gráfico de Pareto, os valores-p, os coeficientes, as estatísticas de resumo do modelo e os gráficos de resíduos.

Etapa 1: Determine quais termos mais contribuem para a variabilidade na resposta

Use um gráfico de Pareto dos efeitos padronizados para comparar a magnitude relativa e a significância estatística dos efeitos principais e de interação. O gráfico exibe o tipo de efeito da seguinte forma:
  • Se o modelo não incluir um termo de erro, o gráfico exibe o valor absoluto dos efeitos não padronizados.
  • Se o modelo incluir um termo de erro, o gráfico exibe o valor absoluto dos efeitos padronizados.

O Minitab representa os efeitos padronizados na ordem decrescente de seus valores absolutos. A linha de referência no gráfico indica que os efeitos são significativos. Por padrão, o Minitab usa um nível de significância de 0,05 para traçar a linha de referência. Sem nenhum termo de erro, o Minitab usa o método de Lenth para traçar a linha de referência.

Resultados principais: gráfico de Pareto

Nestes resultados, os quatro efeitos principais são estatisticamente significativos (α = 0,05). Estes efeitos significativos incluem todos os quatro efeitos principais - tipo de material (A), a pressão da injeção (B), temperatura da injeção (C) e temperatura de arrefecimento (D)

Além disso, é possível ver que o maior efeito é a pressão de injeção (B), porque ele se estende para mais além. O efeito da pressão de injeção pela interação da temperatura de arrefecimento (BD) é o menor porque é o que menos se estende.

Etapa 2: Determine quais termos exercem efeitos estatisticamente significativos sobre a resposta

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que o coeficiente do termo é igual a zero, o que implica a não existência de uma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Se um termo do modelo for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
  • Se um coeficiente para um fator for significativo, é possível concluir que nem todas as médias de nível são iguais.
  • Se um coeficiente de uma covariável for significativo, as mudanças no valor da variável estão associadas às mudanças no valor médio da resposta.
  • Se um coeficiente para uma interação é significativo, a relação entre um fator e a resposta depende dos outros fatores do termo. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação.

Análise de Variância

FonteGLSQ (Aj.)QM (Aj.)Valor FValor-P
Modelo11451,35741,03217,990,007
  Covariáveis13,5913,5911,580,278
    TempMed13,5913,5911,580,278
  Linear4304,58776,14733,390,002
    Material135,05335,05315,370,017
    PressInj1113,068113,06849,590,002
    TempInj175,53375,53333,120,005
    TempFria138,66638,66616,960,015
  Interações de 2 fatores620,3093,3851,480,366
    Material*PressInj11,7321,7320,760,433
    Material*TempInj13,0453,0451,340,312
    Material*TempFria10,0950,0950,040,848
    PressInj*TempInj11,5381,5380,670,458
    PressInj*TempFria10,0120,0120,010,947
    TempInj*TempFria114,69414,6946,440,064
Erro49,1212,280   
Total15460,478     
Principais resultados: Valor-p, Coeficientes

Nestes resultados, os efeitos principais para Material, InjPress, InjTemp e CoolTemp são estatisticamente significativos no nível de significância de 0,05. É possível concluir que as mudanças nessas variáveis estão associadas às alterações nas variáveis resposta.

MeasTemp é uma covariável neste modelo. O coeficiente para o efeito principal representa a mudança na resposta média para o aumento da unidade um na covariável, enquanto os outros termos no modelo são mantidos constantes. Para cada aumento de um grau na temperatura, a força da média estimada é reduzida em −1,229.

Os termos de interação bidirecional não são estatisticamente significativos. A relação entre cada uma das variáveis e a resposta pode não depender do valor da outra variável.

Etapa 3: Determinar quão bem o modelo se ajusta aos seus dados

Para determinar se o modelo ajusta bem os dados, examine as estatísticas de qualidade do ajuste tabela do resumo do modelo.

S

Use S para avaliar se o modelo descreve bem a resposta. Use S em vez das estatísticas de R2 para comparar o ajuste de modelos que não têm constante.

S é medido nas unidades da variável de resposta e representa o quão longe os valores de dados caem dos valores ajustados. Quanto mais baixo for o valor de S, melhor o modelo descreve a resposta. No entanto, um valor de S baixo por si só não indica que o modelo satisfaz aos pressupostos do modelo. Você deve verificar os gráficos de resíduos para conferir os pressupostos.

R2

Quanto mais alto o valor de R2 melhor o modelo ajusta seus dados. O valor de R2 está sempre entre 0 e 100%.

O R2 sempre aumenta quando você adiciona mais preditores a um modelo. Por exemplo, o melhor modelo de cinco preditores terá sempre um R2 que é pelo menos tão elevado quanto o melhor modelo de quatro preditores. Portanto, R2 é mais útil quando for comparado a modelos do mesmo tamanho.

R2 (aj)

Use o R2 ajustado quando desejar comparar modelos que têm diferentes números de preditores. R2 sempre aumenta quando você adiciona um preditor ao modelo, mesmo quando não existe uma verdadeira melhoria ao modelo. O valor de R2 ajustado incorpora o número de preditores no modelo para ajudá-lo a escolher o modelo correto.

R2 (pred)

Use R2 predito para determinar o quão bem seu modelo prediz as respostas para novas observações. Modelos que têm valores de R2 predito mais elevado têm melhor capacidade preditiva.

Um R2 predito que é substancialmente menor que o R2 pode indicar que o modelo está com excesso de ajuste. Um modelo com excesso de ajuste ocorre quando você adiciona termos para efeitos que não são importantes na população. O modelo se adapta aos dados de amostra e, por conseguinte, pode não ser útil para fazer predições em relação à população.

O R2 previsto também pode ser mais útil do que o R2 ajustado para a comparação de modelos, porque ele é calculado com as observações que não estão incluídas no cálculo do modelo.

AICc e BIC
Quando você mostra os detalhes para cada etapa de um método stepwise ou quando você mostra os resultados expandidos da análise, o Minitab mostra mais duas estatísticas. Essas estatísticas são o Critério de Informação de Akaike Corrigido (AICc) e o Critério de Informação Bayesiano (BIC). Use essas estatísticas para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis. O Minitab não mostra essas estatísticas para projetos de parcelas divididas.
Considere os seguintes pontos quando interpretar as estatísticas de qualidade de ajuste:
  • Amostras pequenas não fornecem uma estimativa precisa da força da relação entre a resposta e os preditores. Se você precisar que R2 seja mais exato, deve usar uma amostra maior (geralmente, 40 ou mais).
  • R2 é apenas uma medida de o quão bem o modelo ajusta os dados. Mesmo quando um modelo tem um R2 elevado, você deve verificar os gráficos de resíduos para conferir se o modelo satisfaz os pressupostos do modelo.

Sumário do Modelo

SR2R2(aj)R2(pred)
1,5100598,02%92,57%70,86%
Principais resultados: S, R2, R2 (aj), R2 (pred)

Nestes resultados, o modelo explica 98,02% da variação na emissão de luz. Por estes dados, o valor de R2 indica que o modelo fornece um bom ajuste aos dados. Se os modelos adicionais forem ajustados com diferentes preditores, utilize os valores de R2 ajustados e os valores de R2 preditos para comparar se os modelos ajustam bem os dados.

Etapa 4: Determinar se o modelo atende às suposições da análise

Use os gráficos de resíduos para ajudar a determinar se o modelo é adequado e satisfaz aos pressupostos da análise. Se os pressupostos não forem satisfeitos, o modelo pode não ajustar bem os dados e você deve ter cautela ao interpretar os resultados.

Para obter mais informações sobre como lidar com os padrões nos gráficos residuais, vá para Gráficos de resíduos para Análise de experimento fatorial e clique no nome do gráfico residual na lista na parte superior da página.

Gráficos de resíduos versus de ajustes

Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo.
Padrão O que o padrão pode indicar
Dispersão grande ou irregular de resíduos entre valores ajustados Variância não constante
Curvilíneo Um termo de ordem mais alta ausente
Um ponto que está distante de zero Um outlier
Um ponto que é distante dos outros pontos na direção x Um ponto influente

Use o gráfico de resíduos versus ajustes para verificar a pressuposição de que os resíduos são aleatoriamente distribuídos e têm variância constante. De maneira ideal, os pontos devem cair aleatoriamente em ambos os lados de 0, sem padrões reconhecíveis nos pontos.

Gráfico de resíduos versus ordem

Use o gráfico de resíduos versus ordem para verificar o pressuposto de que os resíduos são independentes um do outro. Resíduos independentes não mostram tendências nem padrões quando exibidos em ordem temporal. Os padrões nos pontos podem indicar que os resíduos próximos uns dos outros podem ser correlacionados e, portanto, não são independentes. De maneira ideal, os resíduos no gráfico devem cair aleatoriamente em torno da linha central:
Se você vir um padrão, investigue a causa. Os seguintes tipos de padrões podem indicar que os resíduos são dependentes.
Tendência
Deslocamento
Ciclo

Gráficos de probabilidade normal dos resíduos

Use o gráfico de probabilidade normal de resíduos para verificar a pressuposição de que os resíduos são distribuídos normalmente. O gráfico de probabilidade normal dos resíduos deve seguir aproximadamente uma linha reta.

Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo.

Padrão O que o padrão pode indicar
Não é uma linha reta Não normalidade
Um ponto que está distante da linha Um outlier
Inclinação em alteração Uma variável não identificada