Los dos métodos producen pequeñas diferencias en los resultados. Por ejemplo, si almacena los resultados con cualquiera de los métodos, las estadísticas de predicción se encuentran en la hoja de cálculo, pero la versión con Descubrir el mejor modelo (Respuesta binaria) también muestra la ecuación de regresión en el panel de salida. La versión con Ajustar modelo logístico binario puede incluir el error estándar del ajuste y el intervalo de confianza para el ajuste. Con cualquiera de los métodos, los resultados en el panel de salida incluyen la ecuación de regresión, la configuración de los predictores y la tabla denominada Predicción.
Para la regresión logística binaria, Minitab muestra dos tipos de ecuaciones de regresión. La primera ecuación relaciona la probabilidad del evento con la respuesta transformada. La forma de la primera ecuación depende de la función de enlace.
La segunda ecuación relaciona los predictores con la respuesta transformada. Si el modelo contiene predictores continuos y categóricos, la segunda ecuación se puede separar para cada combinación de categorías.
Utilice las ecuaciones para examinar la relación entre la respuesta y las variables predictoras.
La primera ecuación muestra la relación entre la probabilidad y la respuesta transformada debido a la función de enlace logit.
La segunda ecuación muestra cómo el ingreso y si un cliente tiene niños se relacionan con la respuesta transformada. Cuando el cliente no tiene niños, el coeficiente de ingreso es aproximadamente 0.04. Cuando el cliente tiene niños, el coeficiente es aproximadamente 0.02. Para estas ecuaciones, mientras mayor es el ingreso de un cliente, más probable es que ese cliente compre el producto. Sin embargo, el ingreso tiene un efecto más fuerte sobre si el cliente compra el producto cuando el cliente no tiene niños.
P(1) | = | exp(Y')/(1 + exp(Y')) |
---|
Niños | |||
---|---|---|---|
No | Y' | = | -3.549 + 0.04296 Ingresos |
Sí | Y' | = | -1.076 + 0.01565 Ingresos |
Si el modelo no es jerárquico y usted estandarizó los predictores continuos, entonces la ecuación de regresión está en unidades codificadas. Para obtener más información, consulte la sección sobre Coeficientes codificados. Para obtener más información sobre la jerarquía, vaya a ¿Qué son modelos jerárquicos?.
Minitab utiliza la ecuación de regresión y la configuración de las variables para calcular el ajuste. Si crea el modelo con Ajustar modelo logístico binario y la configuración delas variables es inusual en comparación con los datos que se utilizaron para estimar el modelo, se mostrará una advertencia debajo de la predicción.
Utilice la tabla de valores de configuración de las variables para comprobar que el análisis se haya realizado tal como estaba previsto.
Al crear el modelo con Descubrir el mejor modelo (Respuesta binaria), la tabla Predicción muestra un número de observación, la clase pronosticada y la probabilidad de pertenencia a cada clase. Al crear el modelo con Ajustar modelo logístico binario, la tabla Predicción incluye la probabilidad ajustada.
La probabilidad del evento es la probabilidad de que ocurra un resultado o evento específico. La probabilidad del evento estima la probabilidad de que ocurra un evento, como sacar un as de un mazo de cartas o producir una pieza no conforme. La probabilidad de un evento varía de 0 (imposible) a 1 (seguro).
En la regresión logística binaria, una variable de respuesta tiene solo dos valores posibles, tales como la presencia o ausencia de una enfermedad específica. La probabilidad del evento es la probabilidad de que la respuesta para un patrón dado de factores o covariables sea 1 para un evento (por ejemplo, la probabilidad de que una mujer mayor de 50 años desarrolle diabetes de tipo 2).
Cada ejecución en un experimento se denomina ensayo. Por ejemplo, si usted lanza una moneda al aire 10 veces y registra el número de caras, usted realiza 10 ensayos del experimento. Si los ensayos son independientes e igual de probables, usted puede estimar la probabilidad del evento dividiendo el número de eventos entre el número total de ensayos. Por ejemplo, si obtiene 6 caras en 10 lanzamientos de moneda, la probabilidad estimada del evento (obtener caras) es:
Número de eventos ÷ Número de ensayos = 6 ÷ 10 = 0.6
El EE de ajuste se encuentra en la tabla Predicción cuando se crea el modelo con Ajustar modelo logístico binario. El error estándar del ajuste (EE de ajuste) estima la variación en la respuesta media estimada para la configuración especificada de las variables. El cálculo del intervalo de confianza para la respuesta media utiliza el error estándar del ajuste. Los errores estándar son siempre no negativos.
Utilice el error estándar del ajuste para medir la precisión de la estimación de la respuesta media. Cuanto menor sea el error estándar, más precisa será la respuesta media pronosticada. Por ejemplo, un analista desarrolla un modelo para pronosticar el tiempo de entrega. Para un conjunto de valores de configuración de las variables, el modelo predice un tiempo medio de entrega de 3.80 días. El error estándar del ajuste para esta configuración es 0.08 días. Para un segundo conjunto de valores de configuración de las variables, el modelo produce el mismo tiempo medio de entrega con un error estándar del ajuste de 0.02 días. El analista puede estar más seguro de que el tiempo medio de entrega del segundo conjunto de valores de configuración de las variables es cercano a 3.80 días.
Con el valor ajustado, puede utilizar el error estándar del ajuste para crear un intervalo de confianza para la respuesta media. Por ejemplo, dependiendo del número de grados de libertad, un intervalo de confianza de 95% se extiende aproximadamente dos errores estándar por encima y por debajo de la media pronosticada. Para los tiempos de entrega, el intervalo de confianza de 95% de la media pronosticada de 3.80 días cuando el error estándar es 0.08 es (3.64, 3.96) días. Puede estar 95% seguro de que la media de la población se encuentra dentro de este rango. Cuando el error estándar es 0.02, el intervalo de confianza de 95% es (3.76, 3.84) días. El intervalo de confianza del segundo conjunto de valores de configuración de las variables es más estrecho porque el error estándar es menor.
El intervalo de confianza para el ajuste se encuentra en la tabla Predicción cuando se crea el modelo con Ajustar modelo logístico binario. Estos intervalos de confianza (IC) son rangos de valores que es muy probable que contengan la probabilidad del evento para la población que incluye los valores observados de las variables predictoras que se encuentran en el modelo.
Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si se toman muchas muestras, un determinado porcentaje de los intervalos de confianza resultantes incluirá el parámetro de población desconocido. El porcentaje de estos intervalos de confianza que contiene el parámetro es el nivel de confianza del intervalo.
Utilice el intervalo de confianza para evaluar la estimación del valor ajustado para los valores observados de las variables.
Por ejemplo, con un nivel de confianza de 95%, puede estar 95% seguro de que el intervalo de confianza contiene la probabilidad del evento para los valores especificados de las variables incluidas en el modelo. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.