Interpretar os principais resultados para Regressão logística ordinal

Conclua as etapas a seguir para interpretar um modelo de regressão de logística ordinal. A saída principal inclui o valor-p, os coeficientes, o log-verossimilhança e as medidas de associação.

Etapa 1: Determinar se a associação entre a resposta e os termos é estatisticamente significativa

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que não há nenhuma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.

Para um fator categórico com mais de 2 níveis, a hipótese para o coeficiente é sobre se aquele nível do fator é diferente do nível de referência do fator. Para avaliar a significância estatística do fator, use o teste para os termos com mais de 1 grau de liberdade. Para obter mais informações sobre como exibir esse teste, vá para Selecione os resultados a serem exibidos para Regressão logística ordinal.

Informações da Resposta

VariávelValorContagem
Consulta de RetornoMuito Provável19
  Um Pouco Provável43
  Improvável11
  Total73

Tabela de Regressão Logística






Razão de
Chances
IC de 95%
PreditorCoef.EP de CoefZPInferiorSuperior
Const(1)-0,5058980,938791-0,540,590     
Const(2)2,277880,9859242,310,021     
Distância-0,04705510,0797374-0,590,5550,950,821,12
Principais resultados: Valor-p, Coeficientes

Uma análise de uma pesquisa de satisfação do paciente examina a relação entre a distância da qual um paciente veio e quão provável é o retorno desse paciente. Nesses resultados, a distância não é estatisticamente significante no nível de significância de 0,05. Não é possível concluir que mudanças nas distâncias estão associadas a mudanças nas probabilidades de que os diferentes eventos ocorram.

Avalie o coeficiente para determinar se uma mudança na variável preditora pode tornar os eventos mais ou menos provavelmente. A relação entre o coeficiente e as probabilidades dependem de diversos aspectos da análise, incluindo a função de link. O coeficientes positivos tornam o primeiro evento e os eventos que estão próximos a ele mais prováveis que os aumentos na preditora. Coeficientes negativos tornam o último evento e os eventos mais próximos dele, mais prováveis que os aumentos da preditora. Para obter mais informações, acesse Coef.

O coeficiente da Distância é cerca de -0,05, que sugere que distâncias maiores são associadas com maiores probabilidades de resposta "Improvável' e com menores probabilidades da resposta "Muito provável".

Etapa 2: Determinar quão bem o modelo se ajusta aos seus dados

Para determinar quão bem o modelo se ajusta aos dados, examine a log-verossimilhança e as medidas de associação. Valores maiores do log-verossimilhança indicam um melhor ajuste aos dados. Como os valores do log-verossimilhança são negativos, quanto mais próximo de 0, maior o valor. O log-verossimilhança depende dos dados da amostra, portanto, você não pode usar o log-verossimilhança para comparar modelos de diferentes conjuntos de dados.

O log-verossimilhança não pode diminuir quando você adiciona termos a um modelo. Por exemplo, um modelo com 5 termos tem maior log-verossimilhança do que quaisquer dos modelos de 4 termos que você pode criar com os mesmos termos. Portanto, o log-verossimilhança é mais útil quando você compara modelos do mesmo tamanho. Para tomar decisões sobre termos individuais, você normalmente examina os valores-p para o termo nos diferentes logits.

Valores maiores para D de Somers, gama de Goodman-Kruskal e tau-a de Kendall indicam que o modelo tem melhor capacidade preditiva. O D de Somers e o gama de Goodman-Kruskal podem estar entre -1 e 1. O tau-a de Kendall pode estar entre -2/3 e 2/3. Valores próximo do máximo indicam que o modelo tem boa capacidade preditiva. Os valores próximos de 0 indicam que o modelo não tem uma relação preditiva com a resposta. Os valores negativos são raros na prática porque aquele desempenho é pior do que quando o modelo e a resposta não estão relacionados.

Função de Ligação: Logito

Informações da Resposta

VariávelValorContagem
Consulta de RetornoMuito Provável19
  Um Pouco Provável43
  Improvável11
  Total73

Tabela de Regressão Logística






Razão de
Chances
IC de 95%
PreditorCoef.EP de CoefZPInferiorSuperior
Const(1)-0,5058980,938791-0,540,590     
Const(2)2,277880,9859242,310,021     
Distância-0,04705510,0797374-0,590,5550,950,821,12
Log-verossimilhança = -68,987

Teste de todas as inclinações igual a zero

GLGValor-P
10,3280,567

Testes de Qualidade de Ajuste

MétodoQui-QuadradoGLP
Pearson97,4191010,582
Deviance100,5161010,495

Medidas de Associação:

(Entre a Variável de Resposta e as Probabilidades Preditas)
ParesNúmeroPercentualMedidas SumáriasValor
Concordantes83255,5D de Somers0,13
Discordantes63742,5Gama de Goodman-Kruskal0,13
Empates302,0Tau-a de Kendall0,07
Total1499100,0   
Principais resultados: log-verossimilhança, D de Somers, gama de Goodman-Kruskal e tau-a de Kendall

Por exemplo, o gerente do consultório de um médico estuda fatores que influenciam a satisfação dos pacientes. Neste primeiro conjunto de resultados, a distância que um paciente viaja para o consultório de um médico prediz qual a probabilidade de o paciente dizer que ele voltará. A log-verossimilhança é de −68,987. O D de Somers e o gama de Goodman-Kruskal é de 0,13. O tau-a de Kendall é de 0,07. Esses valores, que estão próximos de 0, sugerem que a relação entre a distância e a resposta é fraca. O valor-p do teste que todas as inclinações são zero é maior do que 0,05, portanto o gerente tenta um modelo diferente.

Neste segundo conjunto de resultados, a distância e o quadrado da distância são ambos preditores. Você não pode usar a log-verossimilhança para comparar esses modelos porque eles têm diferentes número de termos. As medidas de associação são maiores para o segundo modelo, o que indica que o segundo modelo apresenta melhor desempenho do que o primeiro modelo.

Regressão Logística Ordinal: Consulta de Retorno versus Distância
Função de Ligação: Logito

Informações da Resposta

VariávelValorContagem
Consulta de RetornoMuito Provável19
  Um Pouco Provável43
  Improvável11
  Total73

Tabela de Regressão Logística






Razão de
Chances
IC de 95%
PreditorCoef.EP de CoefZPInferiorSuperior
Const(1)6,386713,061102,090,037     
Const(2)9,318833,159292,950,003     
Distância-1,256080,523879-2,400,0170,280,100,80
Distância*Distância0,04954270,02146362,310,0211,051,011,10
Log-verossimilhança = -66,118

Teste de todas as inclinações igual a zero

GLGValor-P
26,0660,048

Testes de Qualidade de Ajuste

MétodoQui-QuadradoGLP
Pearson114,9031000,146
Deviance94,7791000,629

Medidas de Associação:

(Entre a Variável de Resposta e as Probabilidades Preditas)
ParesNúmeroPercentualMedidas SumáriasValor
Concordantes93862,6D de Somers0,29
Discordantes50533,7Gama de Goodman-Kruskal0,30
Empates563,7Tau-a de Kendall0,16
Total1499100,0