Use um gráfico de Pareto dos efeitos padronizados para comparar a magnitude relativa e a significância estatística dos efeitos principais, quadrados e de interação.
O Minitab representa os efeitos padronizados na ordem decrescente de seus valores absolutos. A linha de referência no gráfico indica que os efeitos são significativos. Por padrão, o Minitab usa um nível de significância de 0,05 para traçar a linha de referência.
Termo | Coef | EP de Coef | VIF |
---|---|---|---|
Constante | 2,394 | 0,145 | |
Tempo de cozimento | 0,7349 | 0,0538 | 1,11 |
Temperatura de cozimento 2 | 0,5451 | 0,0541 | 1,20 |
Tempo de cozimento*Tempo de cozimento | -0,384 | 0,153 | 1,04 |
Tempo de cozimento*Temperatura de cozimento 2 | -0,5106 | 0,0562 | 1,24 |
Nestes resultados, os coeficientes para Tempo de cozimento e Temperatura de cozimento 2 são números positivos. O coeficiente para o termo ao quadrado de Tempo de cozimento e o coeficiente para o termo de interação entre Tempo de cozimento e Temperatura de cozimento 2 são números negativos. Geralmente, os coeficientes positivos tornam o evento mais provável e os coeficientes negativos tornam o evento menos provável à medida que o valor do termo aumenta.
Fonte | GL | Desv (Aj.) | Média (Aj.) | Qui-Quadrado |
---|---|---|---|---|
Modelo | 4 | 737,452 | 184,363 | 737,45 |
Tempo de cozimento | 1 | 203,236 | 203,236 | 203,24 |
Temperatura de cozimento 2 | 1 | 100,432 | 100,432 | 100,43 |
Tempo de cozimento*Tempo de cozimento | 1 | 6,770 | 6,770 | 6,77 |
Tempo de cozimento*Temperatura de cozimento 2 | 1 | 80,605 | 80,605 | 80,61 |
Erro | 45 | 32,276 | 0,717 | |
Total | 49 | 769,728 |
Fonte | Valor-P |
---|---|
Modelo | 0,000 |
Tempo de cozimento | 0,000 |
Temperatura de cozimento 2 | 0,000 |
Tempo de cozimento*Tempo de cozimento | 0,009 |
Tempo de cozimento*Temperatura de cozimento 2 | 0,000 |
Erro | |
Total |
Nestes resultados, os principais efeitos para Tempo de cozimento e Temperatura de cozimento 2 são estatisticamente significativos ao nível 0,05. É possível concluir que as mudanças nessas variáveis estão associadas às alterações nas variáveis resposta. Como os termos de ordem mais alta estão no modelo, os coeficientes dos efeitos principais não descrevem completamente o efeito desses fatores.
O termo ao quadrado para Tempo de cozimento é significativo. É possível concluir que as mudanças nessas variáveis estão associadas à variável resposta, mas a associação não é linear.
O efeito de interação entre Tempo de cozimento e Temperatura de cozimento 2 é significativo. Você pode concluir que o efeito na cor das mudanças em Tempo de cozimento depende do nível de Temperatura de cozimento 2. Equivalentemente, você pode concluir que o efeito na cor das mudanças Temperatura de cozimento 2 depende do nível de Tempo de cozimento.
Unidade de Mudança | Razão de Chances | IC de 95% | |
---|---|---|---|
Tempo de cozimento | 2 | * | (*; *) |
Temperatura de cozimento 2 | 15 | 2,1653 | (1,9652; 2,3858) |
Nestes resultados, o modelo possui 3 termos para prever se a cor dos pretzels atende aos padrões de qualidade possui 3 termos: Tempo de cozimento, Temperatura de cozimento 2, e termo ao quadrado para Tempo de cozimento. Neste exemplo, uma cor aceitável é o evento.
A unidade de mudança mostra a diferença em unidades naturais para uma unidade codificada no experimento. Por exemplo, em unidades naturais, o nível baixo de Temperatura de cozimento 2 é 127. O alto nível é de 157 graus. A distância do nível baixo até o ponto médio representa uma mudança de 1 unidade codificada. Nesse caso, essa distância é de 15 graus.
A razão de chances para Temperatura de cozimento 2 é aproximadamente 2,17. Para cada 15 graus que a temperatura sobe, as chances de que a cor do pretzel seja aceitável aumentam em cerca de 2,17 vezes.
A razão de chances para Tempo de cozimento está ausente porque o modelo inclui o termo ao quadrado para Tempo de cozimento. A razão de chances não tem um valor fixo porque o valor depende do valor de Tempo de cozimento.
Nível A | Nível B | Razão de Chances | IC de 95% |
---|---|---|---|
Mês | |||
2 | 1 | 1,1250 | (0,0600; 21,0834) |
3 | 1 | 3,3750 | (0,2897; 39,3165) |
4 | 1 | 7,7143 | (0,7461; 79,7592) |
5 | 1 | 2,2500 | (0,1107; 45,7172) |
6 | 1 | 6,0000 | (0,5322; 67,6397) |
3 | 2 | 3,0000 | (0,2547; 35,3325) |
4 | 2 | 6,8571 | (0,6556; 71,7169) |
5 | 2 | 2,0000 | (0,0976; 41,0019) |
6 | 2 | 5,3333 | (0,4679; 60,7946) |
4 | 3 | 2,2857 | (0,4103; 12,7323) |
5 | 3 | 0,6667 | (0,0514; 8,6389) |
6 | 3 | 1,7778 | (0,2842; 11,1200) |
5 | 4 | 0,2917 | (0,0252; 3,3719) |
6 | 4 | 0,7778 | (0,1464; 4,1326) |
6 | 5 | 2,6667 | (0,2124; 33,4861) |
Nesses resultados, o preditor categórico é o mês de início de uma estação atarefada do hotel. As resposta é se um hóspede cancela uma reserva ou não. Neste exemplo, um cancelamento é o Evento. A maior razão de chances é de aproximadamente 7,71, quando o nível A é o mês 4 e o nível B é o mês 1. Isso indica que as chances de que um hóspede cancele uma reserva no mês 4 é de aproximadamente 8 vezes mais alta do que as chances de um hóspede cancelar uma reserva no mês 1.
Para determinar se o modelo ajusta bem os dados, examine as estatísticas de qualidade do ajuste tabela do resumo do modelo.
Muitas das estatísticas de resumo do modelo e de qualidade de ajuste são afetadas pelo modo como os dados são organizados na worksheet e se há um ensaio por linha ou vários ensaios por linha. O teste Hosmer-Lemeshow não é afetado pela forma como os dados são organizados e é comparável entre um ensaio por linha e vários ensaios por linha. Para obter mais informações, acesse Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.
Quanto maior o valor do deviance R2, melhor o modelo de adapta aos seus dados. O R2 de deviance está sempre entre 0 e 100%.
O R2 deviance sempre aumenta quando é adicionado termos a um modelo. Por exemplo, o melhor modelo de cinco termos sempre terá um deviance R2 que seja pelo menos tão alto quanto o melhor modelo de quatro preditor. Portanto, R2 da desviância é mais útil quando for comparado a modelos do mesmo tamanho.
O arranjo dos dados afeta o valor de R2 da desviância. O R2 da desviância normalmente é mais alto para dados com múltiplos ensaios por linha que para dados com um único ensaio por linha. Os valores de R2 da desviância só são comparáveis entre os modelos que usam o mesmo formato de dados.
A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um valor desejável, você deve verificar os gráficos de resíduos e testes de qualidade do ajuste para avaliar se um modelo ajusta bem os dados.
Use o R2 do deviance ajustado para comparar modelos que têm número de termos diferentes. O R2 de deviance sempre aumenta quando você adiciona um termo ao modelo. O valor de R2 da desviância ajustado incorpora o número de termos no modelo para ajudá-lo a escolher o modelo correto.
R2 Deviance | R2 (Aj.) Deviance | AIC | AICc | BIC |
---|---|---|---|---|
95,81% | 95,16% | 243,85 | 245,80 | 255,32 |
Nesses resultados, o modelo explica 95,81% do total de desviância na variável de resposta. Para esses dados, o valor R2 da desviância indica que o modelo fornece um bom ajuste para os dados. Se modelos adicionais forem ajustados com termos diferentes, use o valor ajustado de deviance R2, o valor de AIC, o valor de AICc e o valor de BIC para comparar o quão bem o modelo se ajusta aos dados.
Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.
Teste | GL | Qui-Quadrado | Valor-P |
---|---|---|---|
Deviance | 44 | 32,26 | 0,905 |
Pearson | 44 | 31,98 | 0,911 |
Hosmer-Lemeshow | 7 | 4,18 | 0,758 |
Nesses resultados, todos os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Os testes não oferecem evidências de que as probabilidades previstas se desviam das probabilidades observadas de uma forma que a distribuição binomial não prevê.