Interpretar os principais resultados para Regressão logística ordinal

Conclua as etapas a seguir para interpretar um modelo de regressão de logística ordinal. A saída principal inclui o valor-p, os coeficientes, o log-verossimilhança e as medidas de associação.

Etapa 1: Determinar se a associação entre a resposta e os termos é estatisticamente significativa

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que não há nenhuma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.

Para um fator categórico com mais de 2 níveis, a hipótese para o coeficiente é sobre se aquele nível do fator é diferente do nível de referência do fator. Para avaliar a significância estatística do fator, use o teste para os termos com mais de 1 grau de liberdade. Para obter mais informações sobre como exibir esse teste, vá para Selecione os resultados a serem exibidos para Regressão logística ordinal.

Informações da Resposta Variável Valor Contagem Consulta de Retorno Muito Provável 19 Um Pouco Provável 43 Improvável 11 Total 73
Tabela de Regressão Logística Razão de IC de 95% Preditor Coef. EP de Coef Z P Chances Inferior Superior Const(1) -0,505898 0,938791 -0,54 0,590 Const(2) 2,27788 0,985924 2,31 0,021 Distância -0,0470551 0,0797374 -0,59 0,555 0,95 0,82 1,12
Principais resultados: Valor-p, Coeficientes

Uma análise de uma pesquisa de satisfação do paciente examina a relação entre a distância da qual um paciente veio e quão provável é o retorno desse paciente. Nesses resultados, a distância é estatisticamente significativa no nível de significância de 0,05. Você pode concluir que as mudanças nas distâncias estão associadas com mudanças nas probabilidades de que os diferentes eventos ocorram.

Avalie o coeficiente para determinar se uma mudança na variável preditora pode tornar os eventos mais ou menos provavelmente. A relação entre o coeficiente e as probabilidades dependem de diversos aspectos da análise, incluindo a função de link. O coeficientes positivos tornam o primeiro evento e os eventos que estão próximos a ele mais prováveis que os aumentos na preditora. Coeficientes negativos tornam o último evento e os eventos mais próximos dele, mais prováveis que os aumentos da preditora. Para obter mais informações, vá para Coef.

O coeficiente da Distância é cerca de -0,05, que sugere que distâncias maiores são associadas com maiores probabilidades de resposta "Improvável' e com menores probabilidades da resposta "Muito provável".

Step 2: Determine how well the model fits your data

Para determinar quão bem o modelo se ajusta aos dados, examine a log-verossimilhança e as medidas de associação. Valores maiores da log-verossimilhança indicam um melhor ajuste aos dados. Como os valores log-verossimilhança são negativos, quanto mais próximo de 0, maior o valor. A log-verossimilhança depende dos dados da amostra, portanto, você não pode usar a log-verossimilhança para comparar modelos de diferentes conjuntos de dados.

A log-verossimilhança não pode diminuir quando você adiciona termos a um modelo. Por exemplo, um modelo com 5 termos tem maior log-verossimilhança do que quaisquer dos modelos de 4 termos que você pode criar com os mesmos termos. Portanto, a log-verossimilhança é mais útil quando você compara modelos do mesmo tamanho. Para tomar decisões sobre termos individuais, você normalmente examina os valores-p para o termo nos diferentes logits.

Valores maiores para D de Somers, gama de Goodman-Kruskal e tau-a de Kendall indicam que o modelo tem melhor capacidade preditiva. O D de Somers e o gama de Goodman-Kruskal podem estar entre -1 e 1. O tau-a de Kendall pode estar entre -2/3 e 2/3. Valores próximo do máximo indicam que o modelo tem boa capacidade preditiva. Os valores próximos de 0 indicam que o modelo não tem uma relação preditiva com a resposta. Os valores negativos são raros na prática porque aquele desempenho é pior do que quando o modelo e a resposta não estão relacionados.

Regressão Logística Ordinal: Consulta de Retorno versus Distância

Função de Ligação: Logito

Informações da Resposta Variável Valor Contagem Consulta de Retorno Muito Provável 19 Um Pouco Provável 43 Improvável 11 Total 73
Tabela de Regressão Logística Razão de IC de 95% Preditor Coef. EP de Coef Z P Chances Inferior Superior Const(1) -0,505898 0,938791 -0,54 0,590 Const(2) 2,27788 0,985924 2,31 0,021 Distância -0,0470551 0,0797374 -0,59 0,555 0,95 0,82 1,12

Log-verossimilhança = -68,987

Teste de todas as inclinações igual a zero GL G Valor-P 1 0,328 0,567
Testes de Qualidade de Ajuste Método Qui-Quadrado GL P Pearson 97,419 101 0,582 Deviance 100,516 101 0,495
Medidas de Associação: (Entre a Variável de Resposta e as Probabilidades Preditas) Pares Número Percentual Medidas Sumárias Concordantes 832 55,5 D de Somers 0,13 Discordantes 637 42,5 Gama de Goodman-Kruskal 0,13 Empates 30 2,0 Tau-a de Kendall 0,07 Total 1499 100,0
Principais resultados: log-verossimilhança, D de Somers, gama de Goodman-Kruskal e tau-a de Kendall

Por exemplo, o gerente do consultório de um médico estuda fatores que influenciam a satisfação dos pacientes. Neste primeiro conjunto de resultados, a distância que um paciente viaja para o consultório de um médico prediz qual a probabilidade de o paciente dizer que ele voltará. A log-verossimilhança é de −68,987. O D de Somers e o gama de Goodman-Kruskal é de 0,13. O tau-a de Kendall é de 0,07. Esses valores, que estão próximos de 0, sugerem que a relação entre a distância e a resposta é fraca. O valor-p do teste que todas as inclinações são zero é maior do que 0,05, portanto o gerente tenta um modelo diferente.

Neste segundo conjunto de resultados, a distância e o quadrado da distância são ambos preditoras. Você não pode usar a log-verossimilhança para comparar esses modelos porque eles têm diferentes número de termos. As medidas de associação são maiores para o segundo modelo, o que indica que o segundo modelo apresenta melhor desempenho do que o primeiro modelo.

Regressão Logística Ordinal: Consulta de Retorno versus Distância

* AVISO * O algoritmo não convergiu depois de 20 iterações. * AVISO * A convergência não foi atingida para o log-verossimilhança ou o critério de estimativas dos parâmetros. * AVISO * Os resultados podem não ser confiáveis. * AVISO * Tente aumentar o número máximo de iterações.

Função de Ligação: Logito

Informações da Resposta Variável Valor Contagem Consulta de Retorno Improvável 2 Muito Provável 3 Um Pouco Provável 4 Total 9
Tabela de Regressão Logística IC de Razão de 95% Preditor Coef. EP de Coef Z P Chances Inferior Const(1) -8,37842 44,7209 -0,19 0,851 Const(2) -6,68100 44,7154 -0,15 0,881 Distância 3,06326 13,2432 0,23 0,817 21,40 0,00 Distância*Distância -0,285089 0,962191 -0,30 0,767 0,75 0,11
Preditor Superior Const(1) Const(2) Distância 4,00884E+12 Distância*Distância 4,96

Log-verossimilhança = -292,087

Teste de todas as inclinações igual a zero GL G Valor-P 2 0,000 1,000
Testes de Qualidade de Ajuste Método Qui-Quadrado GL P Pearson 79,970 100 0,930 Deviance 541,172 100 0,000
Medidas de Associação: (Entre a Variável de Resposta e as Probabilidades Preditas) Pares Número Percentual Medidas Sumárias Concordantes 274 79,2 D de Somers 0,77 Discordantes 6 1,7 Gama de Goodman-Kruskal 0,96 Empates 66 19,1 Tau-a de Kendall 0,10 Total 346 100,0
Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política