Interpretar os principais resultados para Análise de resposta binária para filtragem de experimentos definitiva

Conclua as etapas a seguir para analisar uma filtragem de experimento. Os principais resultados incluem o gráfico de Pareto, os valores-p, os coeficientes, as estatísticas de resumo do modelo e os gráficos de resíduos.

Etapa 1: Determinar quais termos têm o maior efeito na resposta

Use um gráfico de Pareto dos efeitos padronizados para comparar a magnitude relativa e a significância estatística dos efeitos principais, quadrados e de interação.

O Minitab representa os efeitos padronizados na ordem decrescente de seus valores absolutos. A linha de referência no gráfico indica que os efeitos são significativos. Por padrão, o Minitab usa um nível de significância de 0,05 para traçar a linha de referência.

Resultados principais: gráfico de Pareto

Nestes resultados, o gráfico inclui apenas termos que estão no modelo. O gráfico mostra que 2 efeitos principais são estatisticamente significativos. Um termo quadrático e um efeito de interação também são estatisticamente significativos.

Além disso, você pode ver que o maior efeito é E, porque se estende mais longe. O efeito para o termo quadrático de EE é o menor porque ele é o menor.

Etapa 2: Determine quais termos exercem efeitos estatisticamente significativos sobre a resposta

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que o coeficiente do termo é igual a zero, o que implica a não existência de uma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Se um coeficiente for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
Fatores
Se o coeficiente de um fator for significativo, você pode concluir que a probabilidade do evento não é a mesma para todos os níveis do fator.
Interações entre fatores
Se um coeficiente para uma interação é significativo, a relação entre um fator e a resposta depende dos outros fatores do termo. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação.
Termos ao quadrado
Se um coeficiente para um termo ao quadrado é significativo, é possível concluir que a relação entre o fator e a resposta segue uma linha curva.
Covariáveis
Se o coeficiente de uma covariável for estatisticamente significativo, é possível concluir que a associação entre a resposta e a covariável é estatisticamente significativa.
Blocos
Se o coeficiente de um bloco é estatisticamente significativo, você pode concluir que a função de ligação para o bloco é diferente do valor médio.
Os valores VIF para os termos são maiores que 1, o que mostra a presença de multicolinearidade. Para obter mais informações, acesse Tabela Coeficientes de Análise de resposta binária para filtragem de experimentos definitiva e clique em VIF.

Coeficientes Codificados

TermoCoefEP de CoefVIF
Constante2,3940,145 
Tempo de cozimento0,73490,05381,11
Temperatura de cozimento 20,54510,05411,20
Tempo de cozimento*Tempo de cozimento-0,3840,1531,04
Tempo de cozimento*Temperatura de cozimento 2-0,51060,05621,24
Principais resultados: Coeficientes

Nestes resultados, os coeficientes para Tempo de cozimento e Temperatura de cozimento 2 são números positivos. O coeficiente para o termo ao quadrado de Tempo de cozimento e o coeficiente para o termo de interação entre Tempo de cozimento e Temperatura de cozimento 2 são números negativos. Geralmente, os coeficientes positivos tornam o evento mais provável e os coeficientes negativos tornam o evento menos provável à medida que o valor do termo aumenta.

Análise de Variância

FonteGLDesv (Aj.)Média (Aj.)Qui-Quadrado
Modelo4737,452184,363737,45
  Tempo de cozimento1203,236203,236203,24
  Temperatura de cozimento 21100,432100,432100,43
  Tempo de cozimento*Tempo de cozimento16,7706,7706,77
  Tempo de cozimento*Temperatura de cozimento 2180,60580,60580,61
Erro4532,2760,717 
Total49769,728   
FonteValor-P
Modelo0,000
  Tempo de cozimento0,000
  Temperatura de cozimento 20,000
  Tempo de cozimento*Tempo de cozimento0,009
  Tempo de cozimento*Temperatura de cozimento 20,000
Erro 
Total 
Principais resultados: valor-p

Nestes resultados, os principais efeitos para Tempo de cozimento e Temperatura de cozimento 2 são estatisticamente significativos ao nível 0,05. É possível concluir que as mudanças nessas variáveis estão associadas às alterações nas variáveis resposta. Como os termos de ordem mais alta estão no modelo, os coeficientes dos efeitos principais não descrevem completamente o efeito desses fatores.

O termo ao quadrado para Tempo de cozimento é significativo. É possível concluir que as mudanças nessas variáveis estão associadas à variável resposta, mas a associação não é linear.

O efeito de interação entre Tempo de cozimento e Temperatura de cozimento 2 é significativo. Você pode concluir que o efeito na cor das mudanças em Tempo de cozimento depende do nível de Temperatura de cozimento 2. Equivalentemente, você pode concluir que o efeito na cor das mudanças Temperatura de cozimento 2 depende do nível de Tempo de cozimento.

Etapa 3: Compreender os efeitos dos preditores

Use a razão de chances para compreender o efeito de uma preditora. A interpretação da razão de chances depende se a preditora é categórica ou contínua. O Minitab calcula razões de chances quando o modelo usa a função de ligação logit.
Razões de Chances para Preditores Contínuos
As razões de chances que são maiores do que 1 indicam que o evento tem mais probabilidade de ocorrer conforme a preditora aumenta. As razões de chances que não menos do que 1 indicam que o evento tem menos probabilidade de ocorrer conforme a preditora aumenta.

Razões de Chances para Preditores Contínuos

Unidade
de
Mudança
Razão de
Chances
IC de 95%
Tempo de cozimento2*(*; *)
Temperatura de cozimento 2152,1653(1,9652; 2,3858)
As razões de chance não são calculadas para preditores que estão incluídas nos termos da
     interação porque essas razões dependem de valores das outras preditores nos termos da
     interação.
Resultado principal: Razão de chances

Nestes resultados, o modelo possui 3 termos para prever se a cor dos pretzels atende aos padrões de qualidade possui 3 termos: Tempo de cozimento, Temperatura de cozimento 2, e termo ao quadrado para Tempo de cozimento. Neste exemplo, uma cor aceitável é o evento.

A unidade de mudança mostra a diferença em unidades naturais para uma unidade codificada no experimento. Por exemplo, em unidades naturais, o nível baixo de Temperatura de cozimento 2 é 127. O alto nível é de 157 graus. A distância do nível baixo até o ponto médio representa uma mudança de 1 unidade codificada. Nesse caso, essa distância é de 15 graus.

A razão de chances para Temperatura de cozimento 2 é aproximadamente 2,17. Para cada 15 graus que a temperatura sobe, as chances de que a cor do pretzel seja aceitável aumentam em cerca de 2,17 vezes.

A razão de chances para Tempo de cozimento está ausente porque o modelo inclui o termo ao quadrado para Tempo de cozimento. A razão de chances não tem um valor fixo porque o valor depende do valor de Tempo de cozimento.

Razões de Chances para Preditores Categóricos
Para preditores categóricos, a razão de chances compara as chances de o evento ocorrer em dois níveis diferentes do preditor. O Minitab define a comparação listando os níveis em 2 colunas, Nível A e Nível B. Nível B é o nível de referência para o fator. A razão de chances que for maior que 1 indica que o evento é mais provável no nível A. A razão de chances que for menor do que 1 indica que o evento é menos provável no nível A. Para obter mais informações sobre codificação de preditores categóricos, acesse Esquemas de codificação para preditores categóricos.

Razões de Chances para Preditores Categóricos

Nível ANível BRazão de
Chances
IC de 95%
Mês     
  211,1250(0,0600; 21,0834)
  313,3750(0,2897; 39,3165)
  417,7143(0,7461; 79,7592)
  512,2500(0,1107; 45,7172)
  616,0000(0,5322; 67,6397)
  323,0000(0,2547; 35,3325)
  426,8571(0,6556; 71,7169)
  522,0000(0,0976; 41,0019)
  625,3333(0,4679; 60,7946)
  432,2857(0,4103; 12,7323)
  530,6667(0,0514; 8,6389)
  631,7778(0,2842; 11,1200)
  540,2917(0,0252; 3,3719)
  640,7778(0,1464; 4,1326)
  652,6667(0,2124; 33,4861)
Razão de chances para o nível A em relação ao nível B
Resultado principal: Razão de chances

Nesses resultados, o preditor categórico é o mês de início de uma estação atarefada do hotel. As resposta é se um hóspede cancela uma reserva ou não. Neste exemplo, um cancelamento é o Evento. A maior razão de chances é de aproximadamente 7,71, quando o nível A é o mês 4 e o nível B é o mês 1. Isso indica que as chances de que um hóspede cancele uma reserva no mês 4 é de aproximadamente 8 vezes mais alta do que as chances de um hóspede cancelar uma reserva no mês 1.

Etapa 4: determine em que medida o modelo ajusta os dados

Para determinar se o modelo ajusta bem os dados, examine as estatísticas de qualidade do ajuste tabela do resumo do modelo.

Observação

Muitas das estatísticas de resumo do modelo e de qualidade de ajuste são afetadas pelo modo como os dados são organizados na worksheet e se há um ensaio por linha ou vários ensaios por linha. O teste Hosmer-Lemeshow não é afetado pela forma como os dados são organizados e é comparável entre um ensaio por linha e vários ensaios por linha. Para obter mais informações, acesse Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.

R2 da desviância

Quanto maior o valor do deviance R2, melhor o modelo de adapta aos seus dados. O R2 de deviance está sempre entre 0 e 100%.

O R2 deviance sempre aumenta quando é adicionado termos a um modelo. Por exemplo, o melhor modelo de cinco termos sempre terá um deviance R2 que seja pelo menos tão alto quanto o melhor modelo de quatro preditor. Portanto, R2 da desviância é mais útil quando for comparado a modelos do mesmo tamanho.

O arranjo dos dados afeta o valor de R2 da desviância. O R2 da desviância normalmente é mais alto para dados com múltiplos ensaios por linha que para dados com um único ensaio por linha. Os valores de R2 da desviância só são comparáveis entre os modelos que usam o mesmo formato de dados.

A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um valor desejável, você deve verificar os gráficos de resíduos e testes de qualidade do ajuste para avaliar se um modelo ajusta bem os dados.

R2 da desviância (aj.)

Use o R2 do deviance ajustado para comparar modelos que têm número de termos diferentes. O R2 de deviance sempre aumenta quando você adiciona um termo ao modelo. O valor de R2 da desviância ajustado incorpora o número de termos no modelo para ajudá-lo a escolher o modelo correto.

AIC, AICc e BIC
Use o AIC, AICc e BIC para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis. No entanto, o modelo com o menor valor para um conjunto de preditores não necessariamente ajusta bem os dados. Use também os testes de qualidade do ajuste e os gráficos de resíduos para avaliar se um modelo ajusta bem os dados.

Sumário do Modelo

R2 DevianceR2 (Aj.)
Deviance
AICAICcBIC
95,81%95,16%243,85245,80255,32
Principais Resultados: Deviance R2, Deviance R2 (aj), AIC, AICc, BIC

Nesses resultados, o modelo explica 95,81% do total de desviância na variável de resposta. Para esses dados, o valor R2 da desviância indica que o modelo fornece um bom ajuste para os dados. Se modelos adicionais forem ajustados com termos diferentes, use o valor ajustado de deviance R2, o valor de AIC, o valor de AICc e o valor de BIC para comparar o quão bem o modelo se ajusta aos dados.

Etapa 5: Determine se o seu modelo não se ajusta aos dados

Use os testes de qualidade do ajuste para determinar se as probabilidades preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Se o valor-p do teste de qualidade do ajuste for menor do que seu nível de significância escolhido, as probabilidade preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Esta lista fornece motivos comuns para o desvio:
  • Função de ligação incorreta
  • Termo de ordem mais alta omitido para variáveis no modelo
  • Preditora omitida que não está no modelo
  • Superdispersão

Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.

As seguintes estatísticas testam a qualidade de ajuste. As estatísticas Deviance e Pearson são afetados pelo modo como os dados são organizados na worksheet e se há uma avaliação por linha ou várias tentativas por linha.
  • Desviância: o valor-p para o teste de desviância tende a ser menor para os dados que têm um único ensaio por arranjo de linha, em comparação com os dados que têm várias tentativas por linha, e geralmente diminui à medida que o número de ensaios por linha diminui. Para dados com ensaios únicos por linha, os resultados do Hosmer-Lemeshow são mais confiáveis.
  • Pearson: a aproximação para a distribuição do qui-quadrado que o teste de Pearson usa é imprecisa quando o número esperado de eventos por linha nos dados é baixo. Assim, o teste de qualidade de ajuste de Pearson é impreciso quando os dados estão no formato de um único ensaio por linha.
  • Hosmer-Lemeshow: o teste de Hosmer-Lemeshow não depende do número de tentativas por linha nos dados como os outros testes de qualidade de ajuste fazem.Quando os dados têm poucos ensaios por linha, o teste de Hosmer-Lemeshow é um indicador mais confiável de o quão bem o modelo ajusta os dados.

Testes de Qualidade de Ajuste

TesteGLQui-QuadradoValor-P
Deviance4432,260,905
Pearson4431,980,911
Hosmer-Lemeshow74,180,758
Principais resultados para formato evento/ensaio: informações de resposta, teste de desviância, teste de Pearson e teste de Hosmer-Lemeshow

Nesses resultados, todos os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Os testes não oferecem evidências de que as probabilidades previstas se desviam das probabilidades observadas de uma forma que a distribuição binomial não prevê.