Use um gráfico de Pareto dos efeitos padronizados para comparar a magnitude relativa e a significância estatística dos efeitos principais, quadrados e de interação.
O Minitab representa os efeitos padronizados na ordem decrescente de seus valores absolutos. A linha de referência no gráfico indica que os efeitos são significativos. Por padrão, o Minitab usa um nível de significância de 0,05 para traçar a linha de referência.
Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que o coeficiente do termo é igual a zero, o que implica a não existência de uma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Termo | Coef | EP de Coef | VIF |
---|---|---|---|
Constante | 3,021 | 0,384 | |
Tempo | 0,210 | 0,139 | 18,53 |
Temperatura | 0,641 | 0,159 | 19,53 |
Pressão | 0,420 | 0,211 | 70,48 |
Tempo*Tempo | -0,0735 | 0,0482 | 1,01 |
Temperatura*Temperatura | 0,2988 | 0,0517 | 1,17 |
Pressão*Pressão | -0,0022 | 0,0277 | 70,24 |
Tempo*Temperatura | -0,0092 | 0,0505 | 1,14 |
Tempo*Pressão | 0,0417 | 0,0342 | 18,12 |
Temperatura*Pressão | -0,0521 | 0,0396 | 19,24 |
Nestes resultados, os coeficientes para os principais efeitos do Tempo, da Temperatura e Pressão são números positivos. O coeficiente para o termo ao quadrado de Tempo*Tempo é um número negativo. Geralmente, os coeficientes positivos tornam o evento mais provável e os coeficientes negativos tornam o evento menos provável à medida que o valor do termo aumenta.
Fonte | GL | Desv (Aj.) | Média (Aj.) | Qui-Quadrado | Valor-P |
---|---|---|---|---|---|
Modelo | 9 | 903,478 | 100,386 | 903,48 | 0,000 |
Tempo | 1 | 2,303 | 2,303 | 2,30 | 0,129 |
Temperatura | 1 | 16,388 | 16,388 | 16,39 | 0,000 |
Pressão | 1 | 3,966 | 3,966 | 3,97 | 0,046 |
Tempo*Tempo | 1 | 2,331 | 2,331 | 2,33 | 0,127 |
Temperatura*Temperatura | 1 | 34,012 | 34,012 | 34,01 | 0,000 |
Pressão*Pressão | 1 | 0,006 | 0,006 | 0,01 | 0,937 |
Tempo*Temperatura | 1 | 0,033 | 0,033 | 0,03 | 0,856 |
Tempo*Pressão | 1 | 1,490 | 1,490 | 1,49 | 0,222 |
Temperatura*Pressão | 1 | 1,731 | 1,731 | 1,73 | 0,188 |
Erro | 5 | 23,404 | 4,681 | ||
Total | 14 | 926,882 |
Nestes resultados, o termo ao quadrado para Temperatura*Temperatura e os principais efeitos para Temperatura e Pressão são significativos ao nível significância α = 0,05.
As razões de chances que são maiores do que 1 indicam que o evento tem mais probabilidade de ocorrer conforme a preditora aumenta. As razões de chances que não menos do que 1 indicam que o evento tem menos probabilidade de ocorrer conforme a preditora aumenta.
Unidade de Mudança | Razão de Chances | IC de 95% | |
---|---|---|---|
Dose (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |
Nesses resultados, o modelo usa o nível de dosagem de um medicamento para predizer a presença ou ausência de bactéria em adultos. Neste exemplo, a ausência de bactérias é o Evento. Cada comprimido contém uma dose de 0,5 mg, portanto, os pesquisadores usam uma mudança de unidade de 0,5 mg. A razão de chances é de aproximadamente 6. Para cada comprimido adicional que um adulto ingere, as chances de que um paciente não tenha a bactéria aumenta cerca de 6 vezes.
Para preditores categóricos, a razão de chances compara as chances de o evento ocorrer em dois níveis diferentes do preditor. O Minitab define a comparação listando os níveis em 2 colunas, Nível A e Nível B. Nível B é o nível de referência para o fator. A razão de chances que forem maiores que 1 indicam que o evento é mais provável a nível A. A razão de chances que forem menores do que 1 indicam que o evento apresenta menor probabilidade no nível A. Para obter mais informações sobre a codificação de preditores categóricos, vá para Esquemas de codificação para preditores categóricos.
Nível A | Nível B | Razão de Chances | IC de 95% |
---|---|---|---|
Mês | |||
2 | 1 | 1,1250 | (0,0600; 21,0834) |
3 | 1 | 3,3750 | (0,2897; 39,3165) |
4 | 1 | 7,7143 | (0,7461; 79,7592) |
5 | 1 | 2,2500 | (0,1107; 45,7172) |
6 | 1 | 6,0000 | (0,5322; 67,6397) |
3 | 2 | 3,0000 | (0,2547; 35,3325) |
4 | 2 | 6,8571 | (0,6556; 71,7169) |
5 | 2 | 2,0000 | (0,0976; 41,0019) |
6 | 2 | 5,3333 | (0,4679; 60,7946) |
4 | 3 | 2,2857 | (0,4103; 12,7323) |
5 | 3 | 0,6667 | (0,0514; 8,6389) |
6 | 3 | 1,7778 | (0,2842; 11,1200) |
5 | 4 | 0,2917 | (0,0252; 3,3719) |
6 | 4 | 0,7778 | (0,1464; 4,1326) |
6 | 5 | 2,6667 | (0,2124; 33,4861) |
Nesses resultados, o preditor categórico é o mês de início de uma estação atarefada do hotel. As resposta é se ou não um hóspede cancela uma reserva. Neste exemplo, um cancelamento é o Evento. A maior razão de chances é de aproximadamente 7,71, quando o nível A é o mês 4 e o nível B é o mês 1. Isso indica que as chances de que um hóspede cancele uma reserva no mês 4 é de aproximadamente 8 vezes mais alta do que as chances de um hóspede cancelar uma reserva no mês 1.
Muitas dos resumos de modelo e estatísticas de teste de qualidade de ajuste são afetados pelo modo como os dados são organizados na worksheet e se há um ensaio por linha ou múltiplos ensaios por linha. O teste Hosmer-Lemeshow não é afetado pela forma como os dados são organizados e é comparável entre um ensaio por linha e vários ensaios por linha. Para obter mais informações, acesse Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.
Normalmente, quanto maior o R2 de deviance, melhor o modelo ajusta os dados. O R2 de deviance está sempre entre 0 e 100%.
O R2 da desviância sempre aumenta quando é adicionado termos a um modelo. Por exemplo, o melhor modelo de cinco termos terá sempre um R2 que é pelo menos tão elevado quanto o modelo de quatro termos. Portanto, R2 da desviância é mais útil quando for comparado a modelos do mesmo tamanho.
O arranjo de dados afeta o valor de R2 da desviância. O R2 da desviância é geralmente maior para dados com múltiplos ensaios por linha do que para dados com um único ensaio por linha. Os valores de R2 da desviância só são comparáveis entre os modelos que usam o mesmo formato de dados.
A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um valor desejável, você deve verificar os gráficos de resíduos e testes de qualidade do ajuste para avaliar se um modelo ajusta bem os dados.
Use o R2 da desviância ajustado quando desejar comparar modelos que têm diferentes números de termos. O R2 da desviância sempre aumenta quando você adiciona um termo ao modelo. O valor de R2 da desviância ajustado incorpora o número de termos no modelo para ajudá-lo a escolher o modelo correto.
Use o AIC, AICc e BIC para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis. No entanto, o modelo com o menor valor para um conjunto de preditores não necessariamente ajusta bem os dados. Use também os testes de qualidade do ajuste e os gráficos de resíduos para avaliar se um modelo ajusta bem os dados.
R2 Deviance | R2 (Aj.) Deviance | AIC | AICc | BIC |
---|---|---|---|---|
97,95% | 76,75% | 105,98 | 171,98 | 114,48 |
Nesses resultados, o modelo explica 97,95% do total de desviância na variável de resposta. Para esses dados, o valor R2 da desviância indica que o modelo fornece um bom ajuste para os dados. Se modelos adicionais estiverem ajustados com preditores diferentes, use o valor R2 da desviância ajustado, o valor de AIC, o valor de AICc e o valor de BIC para comparar o grau de ajuste do modelo aos dados.
Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.
Variável | Valor | Contagem | Nome do Evento |
---|---|---|---|
Deterioração | Evento | 506 | Event |
Não-evento | 7482 | ||
Contêineres | Total | 7988 |
Teste | GL | Qui-Quadrado | Valor-P |
---|---|---|---|
Deviance | 5 | 0,97 | 0,965 |
Pearson | 5 | 0,97 | 0,965 |
Hosmer-Lemeshow | 6 | 0,10 | 1,000 |
Nesses resultados, todos os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Os testes não oferecem evidências de que as probabilidades previstas se desviam das probabilidades observadas de uma forma que a distribuição binomial não prevê.