Interpretar os principais resultados para Análise de experimento de filtragem definitivo

Conclua as etapas a seguir para analisar uma filtragem de experimento. Os principais resultados incluem o gráfico de Pareto, os valores-p, os coeficientes, as estatísticas de resumo do modelo e os gráficos de resíduos.

Etapa 1: Determine quais termos mais contribuem para a variabilidade na resposta

Use um gráfico de Pareto dos efeitos padronizados para comparar a magnitude relativa e a significância estatística dos efeitos.

O Minitab representa os efeitos padronizados na ordem decrescente de seus valores absolutos. A linha de referência no gráfico indica que os efeitos são estatisticamente significativos.

Resultados principais: gráfico de Pareto

Nestes resultados, os termos que estão no modelo têm barras azuis. Os termos que não estão no modelo têm barras cinza. O gráfico mostra que 2 efeitos principais são estatisticamente significativos ao nível de significância α = 0,05. Um termo quadrático e um efeito de interação também são significativos. Os principais efeitos que são partes da interação e o termo quadrático estão no modelo, apesar de estes efeitos não serem estatisticamente significativos.

Além disso, é possível ver que o maior efeito é A porque se estende para mais distante. O efeito para o termo quadrático EE é o menor efeito no gráfico.

Etapa 2: Determine quais termos exercem efeitos estatisticamente significativos sobre a resposta

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que o coeficiente do termo é igual a zero, o que implica a não existência de uma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Se um coeficiente for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
Fatores
Se o coeficiente de um fator for estatisticamente significativo, é possível concluir que o coeficiente para o fator não é igual a 0.
Interações entre fatores
Se o coeficiente para uma interação for estatisticamente significativo, é possível concluir que a relação entre um fator e a resposta depende dos outros fatores no termo.
Termos quadráticos
Se o coeficiente para um termo quadrático for estatisticamente significativo, é possível concluir que a superfície de resposta contém curvatura.
Covariáveis
Se o coeficiente de uma covariável for estatisticamente significativo, é possível concluir que a associação entre a resposta e a covariável é estatisticamente significativa.
Blocos
Se o coeficiente de um bloco for estatisticamente significativo, é possível concluir que a média dos valores de resposta nesse bloqueio é diferente da média global da resposta.
Os valores de VIF para o termo quadrático e o termo de interação não são 1, o que mostra a presença de multicolinearidade. Para obter mais informações, acesse Tabela Coeficientes de Análise de experimento de filtragem definitivo e clique em VIF.

Coeficientes Codificados

TermoCoefEP de CoefValor-TValor-PVIF
Constante617,115,041,160,000 
Treinar52,416,538,020,0001,00
Explosão8,626,531,320,2201,00
Silencioso-39,596,53-6,060,0001,00
Centro-2,366,53-0,360,7271,00
Varrer2,846,530,440,6741,00
Varrer*Varrer49,416,72,950,0161,16
Explosão*Centro24,637,593,250,0101,16
Principais resultados: Valor-p, Coeficientes

Nestes resultados, os efeitos principais para Treino e Silêncio são estatisticamente significativos ao nível 0,05. É possível concluir que as mudanças nessas variáveis estão associadas às alterações nas variáveis de resposta.

O efeito principal para a Varredura não é estatisticamente significativo, mas o efeito quadrático sim. É possível concluir que as mudanças nessas variáveis estão associadas à variável de resposta, mas a associação não é linear.

Os efeitos principais para Explosão e Centro não são estatisticamente significativos, mas o efeito de interação sim. É possível concluir que as mudanças nessas variáveis estão associadas às alterações na variável de resposta, mas os efeitos dependem do outro fator.

Etapa 3: Determinar quão bem o modelo se ajusta aos seus dados

Para determinar se o modelo ajusta bem os dados, examine as estatísticas de qualidade do ajuste tabela do resumo do modelo.

S

Use S para avaliar se o modelo descreve bem a resposta.

S é medido nas unidades da variável de resposta e representa o quão longe os valores de dados caem dos valores ajustados. Quanto mais baixo for o valor de S, melhor o modelo descreve a resposta. No entanto, um valor de S baixo por si só não indica que o modelo satisfaz aos pressupostos do modelo. Você deve verificar os gráficos de resíduos para conferir os pressupostos.

R2

Quanto mais alto o valor de R2 melhor o modelo ajusta seus dados. O valor de R2 está sempre entre 0 e 100%.

O R2 sempre aumenta quando você adiciona mais preditores a um modelo. Por exemplo, o melhor modelo de cinco preditores terá sempre um R2 que é pelo menos tão elevado quanto o melhor modelo de quatro preditores. Portanto, R2 é mais útil quando for comparado a modelos do mesmo tamanho.

R2 (aj)

Use o R2 ajustado quando desejar comparar modelos que têm diferentes números de preditores. R2 sempre aumenta quando você adiciona um preditor ao modelo, mesmo quando não existe uma verdadeira melhoria ao modelo. O valor de R2 ajustado incorpora o número de preditores no modelo para ajudá-lo a escolher o modelo correto.

R2 (pred)

Use R2 predito para determinar o quão bem seu modelo prediz as respostas para novas observações. Modelos que têm valores de R2 predito mais elevado têm melhor capacidade preditiva.

Um R2 predito que é substancialmente menor que o R2 pode indicar que o modelo está com excesso de ajuste. Um modelo com excesso de ajuste ocorre quando você adiciona termos para efeitos que não são importantes na população. O modelo se adapta aos dados de amostra e, por conseguinte, pode não ser útil para fazer predições em relação à população.

O R2 previsto também pode ser mais útil do que o R2 ajustado para a comparação de modelos, porque ele é calculado com as observações que não estão incluídas no cálculo do modelo.

AICc e BIC
Quando você mostra os detalhes para cada etapa de um método stepwise ou quando você mostra os resultados expandidos da análise, o Minitab mostra mais duas estatísticas. Essas estatísticas são o Critério de Informação de Akaike Corrigido (AICc) e o Critério de Informação Bayesiano (BIC). Use essas estatísticas para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis.
Considere os seguintes pontos quando interpretar as estatísticas de qualidade de ajuste:
  • Amostras pequenas não fornecem uma estimativa precisa da força da relação entre a resposta e os preditores. Por exemplo, se você precisar que R2 seja mais exato, deve usar uma amostra maior (geralmente, 40 ou mais).
  • A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um um valor desejável, você deve verificar os gráficos de resíduos para conferir se o modelo atende aos pressupostos do modelo.

Sumário do Modelo

SR2R2(aj)R2(pred)
24,448293,68%88,77%76,78%
Principais resultados: S, R2, R2 (aj), R2 (pred)

Nestes resultados, o modelo explica 93,68% da variação. Por estes dados, o valor de R2 indica que o modelo fornece um bom ajuste aos dados. Se os modelos adicionais forem ajustados com termos diferentes, utilize os valores de R2 ajustados e os valores de R2 preditos para comparar se os modelos ajustam bem os dados.

Etapa 4: Determinar se o modelo atende às suposições da análise

Use os gráficos de resíduos para ajudar a determinar se o modelo é adequado e satisfaz aos pressupostos da análise. Se os pressupostos não forem satisfeitos, o modelo pode não ajustar bem os dados e você deve ter cautela ao interpretar os resultados.

Para obter mais informações sobre como lidar com os padrões nos gráficos residuais, vá para Gráficos de resíduos para Análise de experimento de filtragem definitivo e clique no nome do gráfico residual na lista na parte superior da página.

Gráficos de resíduos versus de ajustes

Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo.
Padrão O que o padrão pode indicar
Dispersão grande ou irregular de resíduos entre valores ajustados Variância não constante
Curvilíneo Um termo de ordem mais alta ausente
Um ponto que está distante de zero Um outlier
Um ponto que é distante dos outros pontos na direção x Um ponto influente

Use o gráfico de resíduos versus ajustes para verificar a pressuposição de que os resíduos são aleatoriamente distribuídos e têm variância constante. De maneira ideal, os pontos devem cair aleatoriamente em ambos os lados de 0, sem padrões reconhecíveis nos pontos.

Gráfico de resíduos versus ordem

Use o gráfico de resíduos versus ordem para verificar o pressuposto de que os resíduos são independentes um do outro. Resíduos independentes não mostram tendências nem padrões quando exibidos em ordem temporal. Os padrões nos pontos podem indicar que os resíduos próximos uns dos outros podem ser correlacionados e, portanto, não são independentes. De maneira ideal, os resíduos no gráfico devem cair aleatoriamente em torno da linha central:
Se você vir um padrão, investigue a causa. Os seguintes tipos de padrões podem indicar que os resíduos são dependentes.
Tendência
Deslocamento
Ciclo

Gráficos de probabilidade normal dos resíduos

Use o gráfico de probabilidade normal de resíduos para verificar a pressuposição de que os resíduos são distribuídos normalmente. O gráfico de probabilidade normal dos resíduos deve seguir aproximadamente uma linha reta.

Os padrões na seguinte tabela podem indicar que o modelo não atende às suposições do modelo.

Padrão O que o padrão pode indicar
Não é uma linha reta Não normalidade
Um ponto que está distante da linha Um outlier
Inclinação em alteração Uma variável não identificada