Interpretar os principais resultados para Análise de resposta binária para experimentos de superfície de resposta

Conclua as etapas a seguir para interpretar um experimento fatorial. O resultado principal inclui os valores-p, os coeficientes, R² e os gráficos de resíduos.

Neste tópico

Etapa 1: Determinar quais termos têm o maior efeito na resposta
Etapa 2: Determine quais termos exercem efeitos estatisticamente significativos sobre a resposta
Etapa 3: Compreender os efeitos dos preditores
Etapa 4: Determine o quão bem o modelo se ajusta aos seus dados
Etapa 5: determine em que medida o modelo não ajusta os dados

Etapa 1: Determinar quais termos têm o maior efeito na resposta

Use um gráfico de Pareto dos efeitos padronizados para comparar a magnitude relativa e a significância estatística dos efeitos principais, quadrados e de interação.

O Minitab representa os efeitos padronizados na ordem decrescente de seus valores absolutos. A linha de referência no gráfico indica que os efeitos são significativos. Por padrão, o Minitab usa um nível de significância de 0,05 para traçar a linha de referência.

Resultados principais: gráfico de Pareto
Nestes resultados, o termo ao quadrado para Temperatura (BB) e os efeitos principais para Temperatura (B) e Pressão (C) são significativos ao nível de significância α = 0,05.
Além disso, é possível ver que o maior efeito é Temperatura*Temperatura (BB), porque se estende para mais longe. Pressão*Pressão (CC) é o menor porque se estende em proporção mínima.

Etapa 2: Determine quais termos exercem efeitos estatisticamente significativos sobre a resposta

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que o coeficiente do termo é igual a zero, o que implica a não existência de uma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.

Valor-p ≤ α: a associação é estatisticamente significativa: Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa: Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.; Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.

Se um termo do modelo for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:

Se o coeficiente de um fator for significativo, você pode concluir que a probabilidade do evento não é a mesma para todos os níveis do fator.
Se um coeficiente para um termo ao quadrado é significativo, é possível concluir que a relação entre o fator e a resposta segue uma linha curva.
Se um coeficiente para uma interação é significativo, a relação entre um fator e a resposta depende dos outros fatores do termo. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação.
Se o coeficiente de um bloco é estatisticamente significativo, você pode concluir que a função de ligação para o bloco é diferente do valor médio.

Coeficientes Codificados

Termo	Coef	EP de Coef	VIF
Constante	3,021	0,384
Tempo	0,210	0,139	18,53
Temperatura	0,641	0,159	19,53
Pressão	0,420	0,211	70,48
Tempo*Tempo	-0,0735	0,0482	1,01
Temperatura*Temperatura	0,2988	0,0517	1,17
Pressão*Pressão	-0,0022	0,0277	70,24
Tempo*Temperatura	-0,0092	0,0505	1,14
Tempo*Pressão	0,0417	0,0342	18,12
Temperatura*Pressão	-0,0521	0,0396	19,24

Principais resultados: Coeficientes

Nestes resultados, os coeficientes para os principais efeitos do Tempo, da Temperatura e Pressão são números positivos. O coeficiente para o termo ao quadrado de Tempo*Tempo é um número negativo. Geralmente, os coeficientes positivos tornam o evento mais provável e os coeficientes negativos tornam o evento menos provável à medida que o valor do termo aumenta.

Análise de Variância

Fonte	GL	Desv (Aj.)	Média (Aj.)	Qui-Quadrado	Valor-P
Modelo	9	903,478	100,386	903,48	0,000
Tempo	1	2,303	2,303	2,30	0,129
Temperatura	1	16,388	16,388	16,39	0,000
Pressão	1	3,966	3,966	3,97	0,046
Tempo*Tempo	1	2,331	2,331	2,33	0,127
Temperatura*Temperatura	1	34,012	34,012	34,01	0,000
Pressão*Pressão	1	0,006	0,006	0,01	0,937
Tempo*Temperatura	1	0,033	0,033	0,03	0,856
Tempo*Pressão	1	1,490	1,490	1,49	0,222
Temperatura*Pressão	1	1,731	1,731	1,73	0,188
Erro	5	23,404	4,681
Total	14	926,882

Principais resultados: valor-p

Nestes resultados, o termo ao quadrado para Temperatura*Temperatura e os principais efeitos para Temperatura e Pressão são significativos ao nível significância α = 0,05.

Etapa 3: Compreender os efeitos dos preditores

Use a razão de chances para compreender o efeito de uma preditora. A interpretação da razão de chances depende se a preditora é categórica ou contínua. O Minitab calcula razões de chances quando o modelo usa a função de ligação logit.

Razões de Chances para Preditores Contínuos

As razões de chances que são maiores do que 1 indicam que o evento tem mais probabilidade de ocorrer conforme a preditora aumenta. As razões de chances que não menos do que 1 indicam que o evento tem menos probabilidade de ocorrer conforme a preditora aumenta.

Razões de Chances para Preditores Contínuos

	Unidade de Mudança	Razão de Chances	IC de 95%
Dose (mg)	0,5	6,1279	(1,7218; 21,8087)

Resultado principal: Razão de chances

Nesses resultados, o modelo usa o nível de dosagem de um medicamento para predizer a presença ou ausência de bactéria em adultos. Neste exemplo, a ausência de bactérias é o Evento. Cada comprimido contém uma dose de 0,5 mg, portanto, os pesquisadores usam uma mudança de unidade de 0,5 mg. A razão de chances é de aproximadamente 6. Para cada comprimido adicional que um adulto ingere, as chances de que um paciente não tenha a bactéria aumenta cerca de 6 vezes.

Razões de Chances para Preditores Categóricos

Para preditores categóricos, a razão de chances compara as chances de o evento ocorrer em dois níveis diferentes do preditor. O Minitab define a comparação listando os níveis em 2 colunas, Nível A e Nível B. Nível B é o nível de referência para o fator. A razão de chances que forem maiores que 1 indicam que o evento é mais provável a nível A. A razão de chances que forem menores do que 1 indicam que o evento apresenta menor probabilidade no nível A. Para obter mais informações sobre a codificação de preditores categóricos, vá para Esquemas de codificação para preditores categóricos.

Razões de Chances para Preditores Categóricos

Nível A	Nível B	Razão de Chances	IC de 95%
Mês
2	1	1,1250	(0,0600; 21,0834)
3	1	3,3750	(0,2897; 39,3165)
4	1	7,7143	(0,7461; 79,7592)
5	1	2,2500	(0,1107; 45,7172)
6	1	6,0000	(0,5322; 67,6397)
3	2	3,0000	(0,2547; 35,3325)
4	2	6,8571	(0,6556; 71,7169)
5	2	2,0000	(0,0976; 41,0019)
6	2	5,3333	(0,4679; 60,7946)
4	3	2,2857	(0,4103; 12,7323)
5	3	0,6667	(0,0514; 8,6389)
6	3	1,7778	(0,2842; 11,1200)
5	4	0,2917	(0,0252; 3,3719)
6	4	0,7778	(0,1464; 4,1326)
6	5	2,6667	(0,2124; 33,4861)

Resultado principal: Razão de chances

Nesses resultados, o preditor categórico é o mês de início de uma estação atarefada do hotel. As resposta é se ou não um hóspede cancela uma reserva. Neste exemplo, um cancelamento é o Evento. A maior razão de chances é de aproximadamente 7,71, quando o nível A é o mês 4 e o nível B é o mês 1. Isso indica que as chances de que um hóspede cancele uma reserva no mês 4 é de aproximadamente 8 vezes mais alta do que as chances de um hóspede cancelar uma reserva no mês 1.

Etapa 4: Determine o quão bem o modelo se ajusta aos seus dados

Para determinar o quão bem o modelo se ajusta aos seus dados, examine as estatísticas de teste de qualidade de ajuste na tabela Resumo do Modelo.

Observação

Muitas dos resumos de modelo e estatísticas de teste de qualidade de ajuste são afetados pelo modo como os dados são organizados na worksheet e se há um ensaio por linha ou múltiplos ensaios por linha. O teste Hosmer-Lemeshow não é afetado pela forma como os dados são organizados e é comparável entre um ensaio por linha e vários ensaios por linha. Para obter mais informações, acesse Como os formatos de dados afetam a qualidade de ajuste na regressão logística binária.

R2 da desviância

Normalmente, quanto maior o R² de deviance, melhor o modelo ajusta os dados. O R² de deviance está sempre entre 0 e 100%.

O R² da desviância sempre aumenta quando é adicionado termos a um modelo. Por exemplo, o melhor modelo de cinco termos terá sempre um R² que é pelo menos tão elevado quanto o modelo de quatro termos. Portanto, R² da desviância é mais útil quando for comparado a modelos do mesmo tamanho.

O arranjo de dados afeta o valor de R² da desviância. O R² da desviância é geralmente maior para dados com múltiplos ensaios por linha do que para dados com um único ensaio por linha. Os valores de R² da desviância só são comparáveis entre os modelos que usam o mesmo formato de dados.

A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um valor desejável, você deve verificar os gráficos de resíduos e testes de qualidade do ajuste para avaliar se um modelo ajusta bem os dados.

R2 da desviância (aj.)

Use o R² da desviância ajustado quando desejar comparar modelos que têm diferentes números de termos. O R² da desviância sempre aumenta quando você adiciona um termo ao modelo. O valor de R² da desviância ajustado incorpora o número de termos no modelo para ajudá-lo a escolher o modelo correto.

AIC, AICc e BIC

Use o AIC, AICc e BIC para comparar modelos diferentes. Para cada estatística, valores menores são preferíveis. No entanto, o modelo com o menor valor para um conjunto de preditores não necessariamente ajusta bem os dados. Use também os testes de qualidade do ajuste e os gráficos de resíduos para avaliar se um modelo ajusta bem os dados.

Sumário do Modelo

R2 Deviance	R2 (Aj.) Deviance	AIC	AICc	BIC
97,95%	76,75%	105,98	171,98	114,48

Principais Resultados: R2 da desviância, R2 (aj) da desviância, AIC

Nesses resultados, o modelo explica 97,95% do total de desviância na variável de resposta. Para esses dados, o valor R² da desviância indica que o modelo fornece um bom ajuste para os dados. Se modelos adicionais estiverem ajustados com preditores diferentes, use o valor R² da desviância ajustado, o valor de AIC, o valor de AICc e o valor de BIC para comparar o grau de ajuste do modelo aos dados.

Etapa 5: determine em que medida o modelo não ajusta os dados

Use os testes de qualidade do ajuste para determinar se as probabilidades preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Se o valor-p do teste de qualidade do ajuste for menor do que seu nível de significância escolhido, as probabilidade preditas se desviam das probabilidades observadas de uma maneira que a distribuição binomial não prediz. Esta lista fornece motivos comuns para o desvio:

Função de ligação incorreta
Termo de ordem mais alta omitido para variáveis no modelo
Preditora omitida que não está no modelo
Superdispersão

Se o desvio é estatisticamente significativo, você pode tentar uma função de ligação diferente ou mudar os termos no modelo.

As seguintes estatísticas testam a qualidade de ajuste. As estatísticas Deviance e Pearson são afetados pelo modo como os dados são organizados na worksheet e se há uma avaliação por linha ou várias tentativas por linha.

Desviância: o valor-p para o teste de desviância tende a ser menor para os dados que têm um único ensaio por arranjo de linha, em comparação com os dados que têm várias tentativas por linha, e geralmente diminui à medida que o número de ensaios por linha diminui. Para dados com ensaios únicos por linha, os resultados do Hosmer-Lemeshow são mais confiáveis.
Pearson: a aproximação para a distribuição do qui-quadrado que o teste de Pearson usa é imprecisa quando o número esperado de eventos por linha nos dados é baixo. Assim, o teste de qualidade de ajuste de Pearson é impreciso quando os dados estão no formato de um único ensaio por linha.
Hosmer-Lemeshow: O teste de Hosmer-Lemeshow não depende do número de tentativas por linha nos dados como os outros testes de qualidade de ajuste fazem.Quando os dados têm poucos ensaios por linha, o teste de Hosmer-Lemeshow é um indicador mais confiável de o quão bem o modelo ajusta os dados.

Informações da Resposta

Variável	Valor	Contagem	Nome do Evento
Deterioração	Evento	506	Event
	Não-evento	7482
Contêineres	Total	7988

Testes de Qualidade de Ajuste

Teste	GL	Qui-Quadrado	Valor-P
Deviance	5	0,97	0,965
Pearson	5	0,97	0,965
Hosmer-Lemeshow	6	0,10	1,000

Principais resultados para formato evento/ensaio: informações de resposta, teste de desviância, teste de Pearson e teste de Hosmer-Lemeshow

Nesses resultados, todos os testes de qualidade do ajuste têm valores-p maiores do que o nível de significância usual de 0,05. Os testes não oferecem evidências de que as probabilidades previstas se desviam das probabilidades observadas de uma forma que a distribuição binomial não prevê.

Interpretar os principais resultados para Análise de resposta binária para experimentos de superfície de resposta

Neste tópico

Etapa 1: Determinar quais termos têm o maior efeito na resposta

Resultados principais: gráfico de Pareto

Etapa 2: Determine quais termos exercem efeitos estatisticamente significativos sobre a resposta

Coeficientes Codificados

Principais resultados: Coeficientes

Análise de Variância

Principais resultados: valor-p

Etapa 3: Compreender os efeitos dos preditores

Razões de Chances para Preditores Contínuos

Resultado principal: Razão de chances

Razões de Chances para Preditores Categóricos

Resultado principal: Razão de chances

Etapa 4: Determine o quão bem o modelo se ajusta aos seus dados

Observação

Sumário do Modelo

Principais Resultados: R2 da desviância, R2 (aj) da desviância, AIC

Etapa 5: determine em que medida o modelo não ajusta os dados

Informações da Resposta

Testes de Qualidade de Ajuste

Principais resultados para formato evento/ensaio: informações de resposta, teste de desviância, teste de Pearson e teste de Hosmer-Lemeshow