Interpretar os principais resultados para Análise de resposta binária para experimentos de superfície de resposta

Conclua as etapas a seguir para interpretar um experimento fatorial. O resultado principal inclui os valores-p, os coeficientes, R2 e os gráficos de resíduos.

Etapa 1: Determinar quais termos têm o maior efeito na resposta

Use um gráfico de Pareto dos efeitos padronizados para comparar a magnitude relativa e a significância estatística dos efeitos principais, quadrados e de interação.

O Minitab representa os efeitos padronizados na ordem decrescente de seus valores absolutos. A linha de referência no gráfico indica que os efeitos são significativos. Por padrão, o Minitab usa um nível de significância de 0,05 para traçar a linha de referência.

Resultados principais: gráfico de Pareto

Nestes resultados, o termo ao quadrado para Temperatura (BB) e os efeitos principais para Temperatura (B) e Pressão (C) são significativos ao nível de significância α = 0,05.

Além disso, é possível ver que o maior efeito é Temperatura*Temperatura (BB), porque se estende para mais longe. Pressão*Pressão (CC) é o menor porque se estende em proporção mínima.

Etapa 2: Determine quais termos exercem efeitos estatisticamente significativos sobre a resposta

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que o coeficiente do termo é igual a zero, o que implica a não existência de uma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.

Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Se um termo do modelo for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
  • Se o coeficiente de um fator for significativo, você pode concluir que a probabilidade do evento não é a mesma para todos os níveis do fator.
  • Se um coeficiente para um termo ao quadrado é significativo, é possível concluir que a relação entre o fator e a resposta segue uma linha curva.
  • Se um coeficiente para uma interação é significativo, a relação entre um fator e a resposta depende dos outros fatores do termo. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação.
  • Se o coeficiente de um bloco é estatisticamente significativo, você pode concluir que a função de ligação para o bloco é diferente do valor médio.

Coeficientes Codificados

TermoCoefEP de CoefVIF
Constante3,0210,384 
Tempo0,2100,13918,53
Temperatura0,6410,15919,53
Pressão0,4200,21170,48
Tempo*Tempo-0,07350,04821,01
Temperatura*Temperatura0,29880,05171,17
Pressão*Pressão-0,00220,027770,24
Tempo*Temperatura-0,00920,05051,14
Tempo*Pressão0,04170,034218,12
Temperatura*Pressão-0,05210,039619,24
Principais resultados: Coeficientes

Nestes resultados, os coeficientes para os principais efeitos do Tempo, da Temperatura e Pressão são números positivos. O coeficiente para o termo ao quadrado de Tempo*Tempo é um número negativo. Geralmente, os coeficientes positivos tornam o evento mais provável e os coeficientes negativos tornam o evento menos provável à medida que o valor do termo aumenta.

Análise de Variância

FonteGLDesv (Aj.)Média (Aj.)Qui-QuadradoValor-P
Modelo9903,478100,386903,480,000
  Tempo12,3032,3032,300,129
  Temperatura116,38816,38816,390,000
  Pressão13,9663,9663,970,046
  Tempo*Tempo12,3312,3312,330,127
  Temperatura*Temperatura134,01234,01234,010,000
  Pressão*Pressão10,0060,0060,010,937
  Tempo*Temperatura10,0330,0330,030,856
  Tempo*Pressão11,4901,4901,490,222
  Temperatura*Pressão11,7311,7311,730,188
Erro523,4044,681   
Total14926,882     
Principais resultados: valor-p

Nestes resultados, o termo ao quadrado para Temperatura*Temperatura e os principais efeitos para Temperatura e Pressão são significativos ao nível significância α = 0,05.

Etapa 3: Compreender os efeitos dos preditores

Use a razão de chances para compreender o efeito de uma preditora. A interpretação da razão de chances depende se a preditora é categórica ou contínua. O Minitab calcula razões de chances quando o modelo usa a função de ligação logit.
Razões de Chances para Preditores Contínuos

As razões de chances que são maiores do que 1 indicam que o evento tem mais probabilidade de ocorrer conforme a preditora aumenta. As razões de chances que não menos do que 1 indicam que o evento tem menos probabilidade de ocorrer conforme a preditora aumenta.

Razões de Chances para Preditores Contínuos

Unidade
de
Mudança
Razão de
Chances
IC de 95%
Dose (mg)0,56,1279(1,7218; 21,8087)
Resultado principal: Razão de chances

Nesses resultados, o modelo usa o nível de dosagem de um medicamento para predizer a presença ou ausência de bactéria em adultos. Neste exemplo, a ausência de bactérias é o Evento. Cada comprimido contém uma dose de 0,5 mg, portanto, os pesquisadores usam uma mudança de unidade de 0,5 mg. A razão de chances é de aproximadamente 6. Para cada comprimido adicional que um adulto ingere, as chances de que um paciente não tenha a bactéria aumenta cerca de 6 vezes.

Razões de Chances para Preditores Categóricos

Para preditores categóricos, a razão de chances compara as chances de o evento ocorrer em dois níveis diferentes do preditor. O Minitab define a comparação listando os níveis em 2 colunas, Nível A e Nível B. Nível B é o nível de referência para o fator. A razão de chances que forem maiores que 1 indicam que o evento é mais provável a nível A. A razão de chances que forem menores do que 1 indicam que o evento apresenta menor probabilidade no nível A. Para obter mais informações sobre a codificação de preditores categóricos, vá para Esquemas de codificação para preditores categóricos.

Razões de Chances para Preditores Categóricos

Nível ANível BRazão de
Chances
IC de 95%
Mês     
  211,1250(0,0600; 21,0834)
  313,3750(0,2897; 39,3165)
  417,7143(0,7461; 79,7592)
  512,2500(0,1107; 45,7172)
  616,0000(0,5322; 67,6397)
  323,0000(0,2547; 35,3325)
  426,8571(0,6556; 71,7169)
  522,0000(0,0976; 41,0019)
  625,3333(0,4679; 60,7946)
  432,2857(0,4103; 12,7323)
  530,6667(0,0514; 8,6389)
  631,7778(0,2842; 11,1200)
  540,2917(0,0252; 3,3719)
  640,7778(0,1464; 4,1326)
  652,6667(0,2124; 33,4861)
Razão de chances para o nível A em relação ao nível B
Resultado principal: Razão de chances

Nesses resultados, o preditor categórico é o mês de início de uma estação atarefada do hotel. As resposta é se ou não um hóspede cancela uma reserva. Neste exemplo, um cancelamento é o Evento. A maior razão de chances é de aproximadamente 7,71, quando o nível A é o mês 4 e o nível B é o mês 1. Isso indica que as chances de que um hóspede cancele uma reserva no mês 4 é de aproximadamente 8 vezes mais alta do que as chances de um hóspede cancelar uma reserva no mês 1.

Etapa 4: Determine o quão bem o modelo se ajusta aos seus dados

Para determinar o quão bem o modelo se ajusta aos seus dados, examine as estatísticas de teste de qualidade de ajuste na tabela Resumo do Modelo.
Observação

Muitas dos resumos de modelo e estatísticas de teste de qualidade de ajuste são afetados pelo modo como os dados são organizados na worksheet e se há um ensaio por linha ou múltiplos ensaios por linha. O teste Hosmer-Lemeshow não é afetado pela forma como os dados são organizados e é comparável entre um ensaio por linha e vários ensaios por linha. Para obter mais informações, acesse Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.

R2 da desviância

Normalmente, quanto maior o R2 de deviance, melhor o modelo ajusta os dados. O R2 de deviance está sempre entre 0 e 100%.

O R2 da desviância sempre aumenta quando é adicionado termos a um modelo. Por exemplo, o melhor modelo de cinco termos terá sempre um R2 que é pelo menos tão elevado quanto o modelo de quatro termos. Portanto, R2 da desviância é mais útil quando for comparado a modelos do mesmo tamanho.

O arranjo de dados afeta o valor de R2 da desviância. O R2 da desviância é geralmente maior para dados com múltiplos ensaios por linha do que para dados com um único ensaio por linha. Os valores de R2 da desviância só são comparáveis entre os modelos que usam o mesmo formato de dados.

A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um valor desejável, você deve verificar os gráficos de resíduos e testes de qualidade do ajuste para avaliar se um modelo ajusta bem os dados.

R2 da desviância (aj.)

Use o R2 da desviância ajustado quando desejar comparar modelos que têm diferentes números de termos. O R2 da desviância sempre aumenta quando você adiciona um termo ao modelo. O valor de R2 da desviância ajustado incorpora o número de termos no modelo para ajudá-lo a escolher o modelo correto.

AIC, AICc e BIC

Use o AIC, AICc e BIC para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis. No entanto, o modelo com o menor valor para um conjunto de preditores não necessariamente ajusta bem os dados. Use também os testes de qualidade do ajuste e os gráficos de resíduos para avaliar se um modelo ajusta bem os dados.

Sumário do Modelo

R2 DevianceR2 (Aj.)
Deviance
AICAICcBIC
97,95%76,75%105,98171,98114,48
Principais Resultados: R2 da desviância, R2 (aj) da desviância, AIC

Nesses resultados, o modelo explica 97,95% do total de desviância na variável de resposta. Para esses dados, o valor R2 da desviância indica que o modelo fornece um bom ajuste para os dados. Se modelos adicionais estiverem ajustados com preditores diferentes, use o valor R2 da desviância ajustado, o valor de AIC, o valor de AICc e o valor de BIC para comparar o grau de ajuste do modelo aos dados.

Etapa 5: determine em que medida o modelo não ajusta os dados

Use os testes de qualidade do ajuste para determinar se as probabilidades preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Se o valor-p do teste de qualidade do ajuste for menor do que seu nível de significância escolhido, as probabilidade preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Esta lista fornece motivos comuns para o desvio:
  • Função de ligação incorreta
  • Termo de ordem mais alta omitido para variáveis no modelo
  • Preditora omitida que não está no modelo
  • Superdispersão

Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.

As seguintes estatísticas testam a qualidade de ajuste. As estatísticas Deviance e Pearson são afetados pelo modo como os dados são organizados na worksheet e se há uma avaliação por linha ou várias tentativas por linha.
  • Desviância: o valor-p para o teste de desviância tende a ser menor para os dados que têm um único ensaio por arranjo de linha, em comparação com os dados que têm várias tentativas por linha, e geralmente diminui à medida que o número de ensaios por linha diminui. Para dados com ensaios únicos por linha, os resultados do Hosmer-Lemeshow são mais confiáveis.
  • Pearson: a aproximação para a distribuição do qui-quadrado que o teste de Pearson usa é imprecisa quando o número esperado de eventos por linha nos dados é baixo. Assim, o teste de qualidade de ajuste de Pearson é impreciso quando os dados estão no formato de um único ensaio por linha.
  • Hosmer-Lemeshow: O teste de Hosmer-Lemeshow não depende do número de tentativas por linha nos dados como os outros testes de qualidade de ajuste fazem.Quando os dados têm poucos ensaios por linha, o teste de Hosmer-Lemeshow é um indicador mais confiável de o quão bem o modelo ajusta os dados.

Informações da Resposta

VariávelValorContagemNome do
Evento
DeterioraçãoEvento506Event
  Não-evento7482 
ContêineresTotal7988 

Testes de Qualidade de Ajuste

TesteGLQui-QuadradoValor-P
Deviance50,970,965
Pearson50,970,965
Hosmer-Lemeshow60,101,000
Principais resultados para formato evento/ensaio: informações de resposta, teste de desviância, teste de Pearson e teste de Hosmer-Lemeshow

Nesses resultados, todos os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Os testes não oferecem evidências de que as probabilidades previstas se desviam das probabilidades observadas de uma forma que a distribuição binomial não prevê.