Métodos y fórmulas para la ecuación estimada en Gráfica de línea ajustada binaria

Seleccione el método o la fórmula de su preferencia.

Coeficientes

Existen dos métodos para encontrar las estimaciones de máxima verosimilitud de los coeficientes. Un método es maximizar directamente la función de verosimilitud con respecto a los coeficientes. Estas expresiones son no lineales en los coeficientes. El método alternativo es usar un enfoque iterativo de mínimos cuadrados reponderados, que es el método que Minitab utiliza para obtener las estimaciones de los coeficientes. McCullagh y Nelder1 muestran que los dos métodos son equivalentes. Sin embargo, el método iterativo de mínimos cuadrados reponderados es más fácil de implementar. Para obtener detalles, véase 1.

[1] P. McCullagh y J. A. Nelder (1989). Generalized Linear Models, 2nd Ed., Chapman & Hall/CRC, London.

Error estándar de coeficientes

El error estándar del iésimo coeficiente es la raíz cuadrada positiva del iésimo elemento diagonal de la matriz de varianzas-covarianzas. La matriz de varianzas-covarianzas tiene la siguiente forma:

W es una matriz diagonal donde los elementos diagonales vienen dados por la siguiente fórmula:

donde

Esta matriz de varianzas-covarianzas se basa en la matriz hessiana observada en contraposición a la matriz de información de Fisher. Minitab utiliza la matriz hessiana observada porque el modelo resultante es más robusto ante cualquier especificación errónea condicional de la media.

Si se utiliza el enlace canónico, entonces la matriz hessiana observada y la matriz de información de Fisher son idénticas.

Notación

TérminoDescription
yiel valor de respuesta para la iésima fila
la respuesta media estimada para la iésima fila
V(·)la función de varianza especificada en la siguiente tabla
g(·)la función de enlace
V '(·)la primera derivada de la función de varianza
g'(·)la primera derivada de la función de enlace
g''(·)la segunda derivada de la función de enlace

La función de varianza depende del modelo:

Modelo Función de varianza
Binomial
Poisson

Para obtener más información, véase [1] y [2].

[1] A. Agresti (1990). Categorical Data Analysis. John Wiley & Sons, Inc.

[2] P. McCullagh y J.A. Nelder (1992). Generalized Linear Model. Chapman & Hall.

Relación de probabilidades para la regresión logística binaria

La relación de probabilidades se proporciona solo si usted selecciona la función de enlace logit para un modelo con una respuesta binaria. En este caso, la relación de probabilidades es útil para interpretar la relación entre un predictor y una respuesta.

La relación de probabilidades (τ) puede ser cualquier número no negativo. Una relación de probabilidades = 1 sirve como base para la comparación. Si τ = 1, no hay ninguna asociación entre la respuesta y el predictor. Si τ < 1, las probabilidades del evento son mayores para el nivel de referencia del factor (o para niveles más bajos de un predictor continuo). Si τ > 1, las probabilidades del evento son menores que el nivel de referencia del factor (o para niveles más bajos de un predictor continuo). Los valores más distantes de 1 representan grados de asociación más fuertes.

Nota

Para el modelo de regresión logística binaria con una covariable o factor, las probabilidades estimadas de éxito son:

La relación exponencial proporciona una interpretación de β: Las probabilidades aumentan de manera multiplicativa en eβ1 por cada incremento de una unidad en x. La relación de probabilidades es equivalente a exp(β1).

Por ejemplo, si β es 0.75, la relación de probabilidades es exp(0.75), que es 2.11. Esto indica que hay un aumento de 111% en las probabilidades de éxito para cada aumento de una unidad en x.

Notación

TérminoDescription
la probabilidad estimada de un éxito para la iésima fila de los datos
el coeficiente estimado de la intersección
el coeficiente estimado para el predictor x
el punto de los datos para la iésima fila

Matriz de varianzas-covarianzas

Una matriz de d x d, donde d es el número de predictores más uno. La varianza de cada coeficiente se encuentra en la celda diagonal y la covarianza de cada par de coeficientes se encuentra en la celda adecuada adyacente a la diagonal. La varianza es el error estándar del coeficiente elevado al cuadrado.

La matriz de varianzas-covarianzas se genera a partir de la última iteración de la inversa de la matriz de información. La matriz de varianzas-covarianzas tiene la siguiente forma:

W es una matriz diagonal donde los elementos diagonales vienen dados por la siguiente fórmula:

donde

Esta matriz de varianzas-covarianzas se basa en la matriz hessiana observada en contraposición a la matriz de información de Fisher. Minitab utiliza la matriz hessiana observada porque el modelo resultante es más robusto ante cualquier especificación errónea condicional de la media.

Si se utiliza el enlace canónico, entonces la matriz hessiana observada y la matriz de información de Fisher son idénticas.

Notación

TérminoDescription
yi el valor de respuesta para la iésima fila
la respuesta media estimada para la iésima fila
V(·)la función de varianza especificada en la siguiente tabla
g(·)la función de enlace
V '(·)la primera derivada de la función de varianza
g'(·)la primera derivada de la función de enlace
g''(·)la segunda derivada de la función de enlace

La función de varianza depende del modelo:

Modelo Función de varianza
Binomial
Poisson

Para obtener más información, véase [1] y [2].

[1] A. Agresti (1990). Categorical Data Analysis. John Wiley & Sons, Inc.

[2] P. McCullagh y J.A. Nelder (1992). Generalized Linear Model. Chapman & Hall.