Interpretar los resultados clave para Regresión logística nominal

Complete los siguientes pasos para interpretar un modelo de regresión logística nominal. La salida clave incluye el valor p, los coeficientes y la log-verosimilitud.

Paso 1: Determinar si la asociación entre la respuesta y los términos es estadísticamente significativa

Para determinar si la asociación entre la respuesta y cada término incluido en el modelo es estadísticamente significativa, compare el valor p del término con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula es que no hay asociación entre el término y la respuesta. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación cuando no hay una asociación real.
Valor p ≤ α: La asociación es estadísticamente significativa
Si el valor p es menor que o igual al nivel de significancia, usted puede concluir que hay una asociación estadísticamente significativa entre la variable de respuesta y el término.
Valor p > α: La asociación no es estadísticamente significativa
Si el valor p es mayor que el nivel de significancia, usted no puede concluir que existe una asociación estadísticamente significativa entre la variable de respuesta y el término. Convendría que vuelva a ajustar el modelo sin el término.
Si hay múltiples predictores sin una asociación estadísticamente significativa con la respuesta, usted puede reducir el modelo eliminando términos uno a la vez. Para obtener más información sobre cómo eliminar términos del modelo, vaya a Reducción del modelo.

Para un factor categórico con más de 2 niveles, la hipótesis para el coeficiente es acerca de si ese nivel del factor es diferente del nivel de referencia para el factor. Para evaluar la significancia estadística del factor, utilice la prueba para los términos con más de 1 grado de libertad. Para obtener más información sobre cómo mostrar esta prueba, vaya a Seleccionar los resultados que se mostrarán para Regresión logística nominal.

Regresión logística nominal: Materia vs. MétodoEnseñ, Edad

Información de respuesta Variable Valor Conteo Materia Ciencia 10 (Evento de referencia) Matemática 11 Artes 9 Total 30
Información del factor Factor Niveles Valores MétodoEnseñ 2 Demostrar, Explicar

Tabla de regresión logística

Predictor Coef SE Coef Z P Logit 1: (Matemática/Ciencia) Constante -1.12266 4.56425 -0.25 0.806 MétodoEnseñ Explicar -0.563115 0.937591 -0.60 0.548 Edad 0.124674 0.401079 0.31 0.756 Logit 2: (Artes/Ciencia) Constante -13.8485 7.24256 -1.91 0.056 MétodoEnseñ Explicar 2.76992 1.37209 2.02 0.044 Edad 1.01354 0.584494 1.73 0.083 Relación de IC de 95% Predictor probabilidades Inferior Superior Logit 1: (Matemática/Ciencia) Constante MétodoEnseñ Explicar 0.57 0.09 3.58 Edad 1.13 0.52 2.49 Logit 2: (Artes/Ciencia) Constante MétodoEnseñ Explicar 15.96 1.08 234.90 Edad 2.76 0.88 8.66

Log-verosimilitud = -26.446

La prueba de que todas las pendientes son cero GL G Valor p 4 12.825 0.012
Pruebas de bondad del ajuste Método Chi-cuadrada GL P Pearson 6.95295 10 0.730 Desviación 7.88622 10 0.640
Resultados clave: Valor p, coeficientes

En estos resultados, los predictores son método de enseñanza y edad. La respuesta es una materia académica preferida por los estudiantes. Ciencia es el nivel de referencia, por lo que los resultados comparan las otras materias con ciencia. En el nivel de significancia 0.05, usted puede concluir que los cambios en el método de enseñanza están asociados con las probabilidades de que los estudiantes prefieran artes a ciencia.

En la tabla de regresión logística, el resultado de comparación es el primer resultado después de la etiqueta logit y el resultado de referencia es el segundo resultado. Los coeficientes positivos hacen que el resultado de comparación sea más probable que el resultado de referencia a medida que aumenta el predictor continuo. Además, los coeficientes positivos hacen que el resultado de comparación sea más probable en el nivel de comparación del predictor categórico que en el nivel de referencia del predictor categórico. Para obtener más información, vaya a Todos los estadísticos y gráficas y haga clic en Coef.

El logit 2 compara artes con ciencia. En el logit 2, el coeficiente de Explicar es aproximadamente 3. Puesto que el valor es positivo, es más probable que los estudiantes prefieran artes a ciencia cuando el método de enseñanza es Explicar.

Paso 2: Determinar qué tan bien se ajusta el modelo a los datos

Para determinar qué tan bien se ajusta el modelo a los datos, examine la log-verosimilitud. Valores más grandes de la log-verosimilitud indican un mejor ajuste a los datos. Puesto que los valores de log-verosimilitud son negativos, cuanto más cercano a 0, mayor será el valor. La log-verosimilitud depende de los datos de la muestra, por lo que no se puede utilizar la log-verosimilitud para comparar modelos de diferentes conjuntos de datos.

La log-verosimilitud no puede disminuir cuando se agregan términos a un modelo. Por ejemplo, un modelo con 5 términos tiene una log-verosimilitud mayor que la de cualquier modelo de 4 términos que se pueda crear con los mismos términos. Por lo tanto, la log-verosimilitud es más útil cuando se comparan modelos del mismo tamaño. Para tomar decisiones sobre términos individuales, por lo general se examinan los valores p del término en los diferentes logits.

Regresión logística nominal: Materia vs. MétodoEnseñ

Información de respuesta Variable Valor Conteo Materia Ciencia 10 (Evento de referencia) Matemática 11 Artes 9 Total 30

Tabla de regresión logística

Predictor Coef SE Coef Z P Logit 1: (Matemática/Ciencia) Constante 0.287682 0.540062 0.53 0.594 MétodoEnseñ Explicar -0.575364 0.935415 -0.62 0.538 Logit 2: (Artes/Ciencia) Constante -1.79176 1.08011 -1.66 0.097 MétodoEnseñ Explicar 2.48491 1.24162 2.00 0.045 Relación de IC de 95% Predictor probabilidades Inferior Superior Logit 1: (Matemática/Ciencia) Constante MétodoEnseñ Explicar 0.56 0.09 3.52 Logit 2: (Artes/Ciencia) Constante MétodoEnseñ Explicar 12.00 1.05 136.79

Log-verosimilitud = -28.379

La prueba de que todas las pendientes son cero GL G Valor p 2 8.959 0.011 * NOTA * No se ha realizado ninguna prueba de bondad de ajuste. * NOTA * El modelo usa todos los grados de libertad.

Regresión logística nominal: Materia vs. MétodoEnseñ, Edad

Información de respuesta Variable Valor Conteo Materia Ciencia 10 (Evento de referencia) Matemática 11 Artes 9 Total 30
Información del factor Factor Niveles Valores MétodoEnseñ 2 Demostrar, Explicar

Tabla de regresión logística

Predictor Coef SE Coef Z P Logit 1: (Matemática/Ciencia) Constante -1.12266 4.56425 -0.25 0.806 MétodoEnseñ Explicar -0.563115 0.937591 -0.60 0.548 Edad 0.124674 0.401079 0.31 0.756 Logit 2: (Artes/Ciencia) Constante -13.8485 7.24256 -1.91 0.056 MétodoEnseñ Explicar 2.76992 1.37209 2.02 0.044 Edad 1.01354 0.584494 1.73 0.083 Relación de IC de 95% Predictor probabilidades Inferior Superior Logit 1: (Matemática/Ciencia) Constante MétodoEnseñ Explicar 0.57 0.09 3.58 Edad 1.13 0.52 2.49 Logit 2: (Artes/Ciencia) Constante MétodoEnseñ Explicar 15.96 1.08 234.90 Edad 2.76 0.88 8.66

Log-verosimilitud = -26.446

La prueba de que todas las pendientes son cero GL G Valor p 4 12.825 0.012
Pruebas de bondad del ajuste Método Chi-cuadrada GL P Pearson 6.95295 10 0.730 Desviación 7.88622 10 0.640
Resultados clave: Log-verosimilitud

Por ejemplo, la administradora de una escuela desea evaluar diferentes métodos de enseñanza. El modelo que solo contiene el método de enseñanza tiene una log-verosimilitud de alrededor de −28.

El modelo que contiene el método de enseñanza y la edad de un estudiante tiene una log-verosimilitud de alrededor de −26. No se puede utilizar la log-verosimilitud para elegir entre estos dos modelos, porque tienen diferentes cantidades de términos.