La salida también identifica qué nivel de la respuesta es el evento de referencia.
Utilice la información de respuesta para examinar la cantidad de datos que están incluidos en el análisis. Las muestras aleatorias más grandes con muchas ocurrencias de cada nivel por lo general proporcionan inferencias más exactas sobre la población.
También puede usar la información de respuesta para determinar qué evento es el evento de referencia. La interpretación de los estadísticos, como los coeficientes y las relaciones de probabilidades, depende de qué evento es el evento de referencia.
La tabla de información de factores muestra los factores incluidos en el diseño, el número de niveles y los valores de los niveles. Los factores solo pueden asumir un número limitado de valores posibles, conocidos como niveles de los factores. Los niveles de los factores pueden ser numéricos o de texto. Los factores numéricos utilizan pocos valores controlados en el experimento, aunque son posibles muchos valores.
Utilice la tabla de información de factores para ver el número de niveles en el análisis. Por ejemplo, un analista de calidad planea estudiar los factores que pueden afectar la resistencia del plástico durante el proceso de manufactura. El analista incluye Aditivo. Aditivo es una variable categórica que puede ser tipo A o tipo B.
Factor | Niveles | Valores |
---|---|---|
Aditivo | 2 | A, B |
Los factores pueden ser cruzados o anidados. Dos factores están cruzados cuando cada nivel de un factor ocurre en combinación con cada nivel del otro factor. Dos factores están anidados cuando un conjunto de los niveles de un factor aparecen solamente en un nivel de un segundo factor. Por ejemplo, si un diseño contiene Máquina y Operador, estos factores están cruzados si todos los operadores usan todas las máquinas. Sin embargo, Operador está anidado en Máquina si cada máquina tiene un conjunto diferente de operadores.
En la tabla de información de factores, los paréntesis indican factores anidados. Por ejemplo, Referencia(Evaluador) indica que el factor Referencia está anidado dentro del factor Evaluador. En este contexto, la anidación indica que cada evaluador tiene su propio conjunto de referencias. Los niveles de un factor anidado se repiten para cada nivel de anidación, con lo cual aumenta el número de niveles del factor anidado. En este ejemplo, cada evaluador tiene 5 referencias, pero como las referencias están anidadas en el evaluador, Referencia tiene 20 niveles diferentes.
Factor | Niveles | Valores |
---|---|---|
Estándar(Evaluador) | 20 | 1(Amanda), 2(Amanda), 3(Amanda), 4(Amanda), 5(Amanda), 1(Britt), 2(Britt), 3(Britt), 4(Britt), 5(Britt), 1(Eric), 2(Eric), 3(Eric), 4(Eric), 5(Eric), 1(Mike), 2(Mike), 3(Mike), 4(Mike), 5(Mike) |
Evaluador | 4 | Amanda, Britt, Eric, Mike |
Para obtener más información sobre los factores, vaya a Factores y niveles de factor, ¿Qué son factores, factores cruzados y factores anidados? y ¿Cuál es la diferencia entre factores fijos y aleatorios?.
La ecuación logística nominal trata cada resultado nominal por separado. La ecuación de regresión logística consta de múltiples funciones logit, una para cada valor de la respuesta menos uno. Cada ecuación tiene una pendiente única para los predictores. Estas ecuaciones evalúan cómo cambia la probabilidad de un resultado nominal en relación con otro resultado nominal a medida que cambian las variables predictoras.
Utilice los coeficientes para examinar cómo cambia la probabilidad de un resultado a medida que cambian las variables predictoras. El coeficiente estimado para un predictor representa el cambio en la función de enlace por cada cambio de una unidad en el predictor, mientras los demás predictores incluidos en el modelo se mantienen constantes. La relación entre el coeficiente y la probabilidad de un resultado depende de varios aspectos del análisis, incluyendo el resultado de referencia para la variable de respuesta y los niveles de referencia para los predictores categóricos. Por lo general, los coeficientes positivos hacen que el resultado de referencia sea menos probable a medida que aumenta el predictor. Los coeficientes negativos hacen que el resultado de referencia sea más probable a medida que aumenta el predictor. Un coeficiente estimado cercano a 0 implica que el efecto del predictor es pequeño.
Por ejemplo, la administradora de una escuela desea evaluar diferentes métodos de enseñanza. Ella utiliza la edad y el método de enseñanza para predecir qué materias prefieren los estudiantes. El primer evento de resultado es el primero de la tabla de información de respuesta y es el resultado de referencia para la variable de respuesta. Para estos datos, el resultado de referencia es que el estudiante prefiere ciencia. El logit 1 compara la probabilidad de que un estudiante prefiera matemática a ciencia. En esta ecuación, el valor p para el coeficiente de edad es mayor que 0.7. Un valor p tan alto sugiere que la edad tiene poco efecto sobre si un estudiante prefiere matemática a ciencia.
El logit 2 compara artes con ciencia. En esta ecuación, el coeficiente de edad es mayor que el coeficiente que compara matemática con ciencia. El coeficiente de edad es positivo. A medida que aumenta la edad, es más probable que los estudiantes prefieran artes a ciencia.
La interpretación de los coeficientes de los predictores categóricos depende del nivel de referencia del factor. En los datos sobre los métodos de enseñanza, los dos niveles del método de enseñanza son "Demostrar" y "Explicar". "Demostrar" no está en la tabla de coeficientes, así que "Demostrar" es el nivel de referencia. El valor p de "Explicar" en la ecuación que compara matemática con ciencia es mayor que 0.5. Un valor p tan alto sugiere que el método de enseñanza tiene poco efecto sobre si un estudiante prefiere matemática a ciencia.
En el logit 2, el coeficiente de "Explicar" es mayor que el coeficiente que compara matemática con ciencia. El valor p de este coeficiente es menor que 0.05, por lo que este coeficiente es estadísticamente significativo en el nivel 0.05. El coeficiente de "Explicar" en esta ecuación es positivo. Cuando el método de enseñanza es "Explicar", es más probable que el estudiante prefiera artes.
Variable | Valor | Conteo | |
---|---|---|---|
Materia | Ciencia | 10 | (Evento de referencia) |
Matemática | 11 | ||
Artes | 9 | ||
Total | 30 |
Factor | Niveles | Valores |
---|---|---|
MétodoEnseñ | 2 | Demostrar, Explicar |
Relación de probabilidades | IC de 95% | |||||
---|---|---|---|---|---|---|
Predictor | Coef | SE Coef | Z | P | Inferior | |
Logit 1: (Matemática/Ciencia) | ||||||
Constante | -1.12266 | 4.56425 | -0.25 | 0.806 | ||
MétodoEnseñ | ||||||
Explicar | -0.563115 | 0.937591 | -0.60 | 0.548 | 0.57 | 0.09 |
Edad | 0.124674 | 0.401079 | 0.31 | 0.756 | 1.13 | 0.52 |
Logit 2: (Artes/Ciencia) | ||||||
Constante | -13.8485 | 7.24256 | -1.91 | 0.056 | ||
MétodoEnseñ | ||||||
Explicar | 2.76992 | 1.37209 | 2.02 | 0.044 | 15.96 | 1.08 |
Edad | 1.01354 | 0.584494 | 1.73 | 0.083 | 2.76 | 0.88 |
IC de 95% | |
---|---|
Predictor | Superior |
Logit 1: (Matemática/Ciencia) | |
Constante | |
MétodoEnseñ | |
Explicar | 3.58 |
Edad | 2.49 |
Logit 2: (Artes/Ciencia) | |
Constante | |
MétodoEnseñ | |
Explicar | 234.90 |
Edad | 8.66 |
GL | G | Valor p |
---|---|---|
4 | 12.825 | 0.012 |
Método | Chi-cuadrada | GL | P |
---|---|---|---|
Pearson | 6.95295 | 10 | 0.730 |
Desviación | 7.88622 | 10 | 0.640 |
El error estándar del coeficiente estima la variabilidad entre las estimaciones del coeficiente que se obtendrían si se tomara las muestras de la misma población una y otra vez. El cálculo asume que el tamaño de la muestra y los coeficientes a estimar se mantendrían iguales si se tomara la muestra una y otra vez.
Utilice el error estándar del coeficiente para medir la precisión de la estimación del coeficiente. Cuanto menor sea el error estándar, más precisa será la estimación.
El valor Z es un estadístico de prueba que mide la relación entre el coeficiente y su error estándar.
Minitab utiliza el valor Z para calcular el valor p, que se usa para tomar una decisión acerca de la significancia estadística de los términos y el modelo. La prueba es exacta cuando el tamaño de la muestra es lo suficientemente grande como para que la distribución de los coeficientes de la muestra siga una distribución normal.
Un valor Z que esté lo suficientemente lejos de 0 indica que la estimación del coeficiente es lo suficientemente grande y precisa como para ser significativamente diferente de 0. En cambio, un valor Z pequeño que está cerca de 0 indica que la estimación del coeficiente es demasiado pequeña o demasiado imprecisa como para asegurar que el término tiene un efecto significativo sobre la respuesta.
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.
La relación de probabilidades compara las probabilidades de dos resultados. Las probabilidades de un resultado son la probabilidad de que ocurra el resultado de comparación dividida entre la probabilidad de que ocurra el resultado de referencia.
Utilice la relación de probabilidades para entender el efecto de un predictor. La interpretación de la relación de probabilidades depende de si el predictor es categórico o continuo. En la tabla de regresión logística, el resultado de comparación es el primer resultado después de la etiqueta logit y el resultado de referencia es el segundo resultado. El resultado de referencia es igual para cada logit.
Las relaciones de probabilidades que son mayores que 1 indican que el resultado de comparación es más probable que el resultado de referencia a medida que aumenta el predictor. Las relaciones de probabilidades que son menores que 1 indican que el resultado de referencia es más probable que el resultado de comparación.
Por ejemplo, la administradora de una escuela desea evaluar diferentes métodos de enseñanza. Para el logit 1, el resultado de comparación es matemática. Para el logit 2, el resultado de comparación es artes. El resultado de referencia es ciencia. En el logit 2, la estimación de la relación de probabilidades es 2.76, que es mayor que 1. A medida que aumenta la edad, es más probable que un estudiante prefiera artes a ciencia. Por cada año de edad adicional, las probabilidades de que un estudiante prefiera artes son 3 veces mayores que las probabilidades de que prefiera ciencia.
Relación de probabilidades | IC de 95% | |||||
---|---|---|---|---|---|---|
Predictor | Coef | SE Coef | Z | P | Inferior | |
Logit 1: (Matemática/Ciencia) | ||||||
Constante | -1.12266 | 4.56425 | -0.25 | 0.806 | ||
MétodoEnseñ | ||||||
Explicar | -0.563115 | 0.937591 | -0.60 | 0.548 | 0.57 | 0.09 |
Edad | 0.124674 | 0.401079 | 0.31 | 0.756 | 1.13 | 0.52 |
Logit 2: (Artes/Ciencia) | ||||||
Constante | -13.8485 | 7.24256 | -1.91 | 0.056 | ||
MétodoEnseñ | ||||||
Explicar | 2.76992 | 1.37209 | 2.02 | 0.044 | 15.96 | 1.08 |
Edad | 1.01354 | 0.584494 | 1.73 | 0.083 | 2.76 | 0.88 |
IC de 95% | |
---|---|
Predictor | Superior |
Logit 1: (Matemática/Ciencia) | |
Constante | |
MétodoEnseñ | |
Explicar | 3.58 |
Edad | 2.49 |
Logit 2: (Artes/Ciencia) | |
Constante | |
MétodoEnseñ | |
Explicar | 234.90 |
Edad | 8.66 |
Para los predictores categóricos, la relación de probabilidades compara las probabilidades del resultado de comparación en dos niveles diferentes del predictor. El nivel de comparación se incluye en la tabla de regresión logística y tiene una relación de probabilidades estimada. Las relaciones de probabilidades que son mayores que 1 indican que el resultado de comparación se vuelve más probable en relación con el resultado de referencia cuando el predictor categórico cambia del nivel de referencia al nivel de comparación. Las relaciones de probabilidades que son menores que 1 indican que el resultado de comparación se vuelve menos probable en relación con el resultado de referencia cuando el predictor categórico cambia del nivel de referencia al nivel de comparación.
Por ejemplo, la administradora de una escuela desea evaluar diferentes métodos de enseñanza. Para el logit 1, el resultado de comparación es matemática. Para el logit 2, el resultado de comparación es artes. El resultado de referencia es ciencia. Para el logit 2, la estimación de la relación de probabilidades para el método de enseñanza es 15.96, que es mayor que 1. Cuando el método de enseñanza cambia de "demostrar" a "explicar", las probabilidades de que un estudiante prefiera artes son aproximadamente 16 veces mayores que las probabilidades de que prefiera ciencia.
Relación de probabilidades | IC de 95% | |||||
---|---|---|---|---|---|---|
Predictor | Coef | SE Coef | Z | P | Inferior | |
Logit 1: (Matemática/Ciencia) | ||||||
Constante | -1.12266 | 4.56425 | -0.25 | 0.806 | ||
MétodoEnseñ | ||||||
Explicar | -0.563115 | 0.937591 | -0.60 | 0.548 | 0.57 | 0.09 |
Edad | 0.124674 | 0.401079 | 0.31 | 0.756 | 1.13 | 0.52 |
Logit 2: (Artes/Ciencia) | ||||||
Constante | -13.8485 | 7.24256 | -1.91 | 0.056 | ||
MétodoEnseñ | ||||||
Explicar | 2.76992 | 1.37209 | 2.02 | 0.044 | 15.96 | 1.08 |
Edad | 1.01354 | 0.584494 | 1.73 | 0.083 | 2.76 | 0.88 |
IC de 95% | |
---|---|
Predictor | Superior |
Logit 1: (Matemática/Ciencia) | |
Constante | |
MétodoEnseñ | |
Explicar | 3.58 |
Edad | 2.49 |
Logit 2: (Artes/Ciencia) | |
Constante | |
MétodoEnseñ | |
Explicar | 234.90 |
Edad | 8.66 |
Estos intervalos de confianza (IC) son rangos de valores que probablemente contienen los verdaderos valores de las relaciones de probabilidades. El cálculo de los intervalos de confianza utiliza la distribución normal. El intervalo de confianza es exacto si el tamaño de la muestra es lo suficientemente grande como para que la distribución de las relaciones de probabilidades de la muestra siga una distribución normal.
Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si toma muchas muestras aleatorias, un determinado porcentaje de los intervalos de confianza resultantes incluirá el parámetro de población desconocido. El porcentaje de estos intervalos de confianza que contiene el parámetro es el nivel de confianza del intervalo.
Utilice el intervalo de confianza para evaluar la estimación de la relación de probabilidades.
Por ejemplo, con un nivel de confianza de 95%, usted puede estar 95% seguro de que el intervalo de confianza contiene el valor de la relación de probabilidades para la poblaicón. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.
Esta prueba es una prueba general que considera todos los coeficientes de un predictor categórico de manera simultánea. La prueba es para los predictores categóricos con más de 2 niveles.
Utilice la prueba para determinar si un predictor categórico con más de 1 coeficiente tiene una relación estadísticamente significativa con los eventos de respuesta. Cuando un predictor categórico tiene más de 2 niveles, los coeficientes de los niveles individuales tienen valores p diferentes. La prueba general proporciona una sola respuesta acerca de si el predictor es estadísticamente significativo.
Minitab maximiza la función de log-verosimilitud para encontrar los valores óptimos de los coeficientes estimados.
Utilice la log-verosimilitud para comparar dos modelos que utilizan los mismos datos para estimar los coeficientes. Puesto que los valores son negativos, cuanto más cercano a 0 esté el valor, mejor se ajustará el modelo a los datos.
La log-verosimilitud no puede disminuir cuando se agregan términos a un modelo. Por ejemplo, un modelo con 5 términos tiene una log-verosimilitud mayor que la de cualquier modelo de 4 términos que se pueda crear con los mismos términos. Por lo tanto, la log-verosimilitud es más útil cuando se comparan modelos del mismo tamaño. Para tomar decisiones sobre términos individuales, por lo general se examinan los valores p del término en los diferentes logits.
Esta prueba es una prueba general que considera todos los coeficientes de los predictores incluidos en el modelo.
Utilice la prueba para determinar si al menos uno de los predictores incluidos en el modelo tiene una asociación estadísticamente significativa con los eventos de respuesta. Por lo general, usted no interpreta el estadístico G ni los grados de libertad (GL). Los GL son iguales al número de coeficientes para los predictores incluidos en el modelo.
La prueba de bondad de ajuste de Pearson evalúa la discrepancia entre el modelo actual y el modelo completo.
La prueba de bondad de ajuste de la desviación evalúa la discrepancia entre el modelo actual y el modelo completo.