Métodos y fórmulas para la ecuación estimada en Ajustar modelo de Poisson

Seleccione el método o la fórmula de su preferencia.

En este tema

Coeficientes
Error estándar de coeficientes
Z
Valor p (P)
Intervalo de confianza
Matriz de varianzas-covarianzas

Coeficientes

Existen dos métodos para encontrar las estimaciones de máxima verosimilitud de los coeficientes. Un método es maximizar directamente la función de verosimilitud con respecto a los coeficientes. Estas expresiones son no lineales en los coeficientes. El método alternativo es usar un enfoque iterativo de mínimos cuadrados reponderados, que es el método que Minitab utiliza para obtener las estimaciones de los coeficientes. McCullagh y Nelder¹ muestran que los dos métodos son equivalentes. Sin embargo, el método iterativo de mínimos cuadrados reponderados es más fácil de implementar. Para obtener detalles, véase 1.

[1] P. McCullagh y J. A. Nelder (1989). Generalized Linear Models, 2^nd Ed., Chapman & Hall/CRC, London.

Error estándar de coeficientes

El error estándar del i^ésimo coeficiente es la raíz cuadrada positiva del i^ésimo elemento diagonal de la matriz de varianzas-covarianzas. La matriz de varianzas-covarianzas tiene la siguiente forma:

W es una matriz diagonal donde los elementos diagonales vienen dados por la siguiente fórmula:

donde

Esta matriz de varianzas-covarianzas se basa en la matriz hessiana observada en contraposición a la matriz de información de Fisher. Minitab utiliza la matriz hessiana observada porque el modelo resultante es más robusto ante cualquier especificación errónea condicional de la media.

Si se utiliza el enlace canónico, entonces la matriz hessiana observada y la matriz de información de Fisher son idénticas.

Notación

Término	Description
y_i	el valor de respuesta para la i^ésima fila
	la respuesta media estimada para la i^ésima fila
V(·)	la función de varianza especificada en la siguiente tabla
g(·)	la función de enlace
V '(·)	la primera derivada de la función de varianza
g'(·)	la primera derivada de la función de enlace
g''(·)	la segunda derivada de la función de enlace

La función de varianza depende del modelo:

Modelo	Función de varianza
Binomial
Poisson

Para obtener más información, véase [1] y [2].

[1] A. Agresti (1990). Categorical Data Analysis. John Wiley & Sons, Inc.

[2] P. McCullagh y J.A. Nelder (1992). Generalized Linear Model. Chapman & Hall.

Z

El estadístico Z se utiliza para determinar si el predictor está significativamente relacionado con la respuesta. Los valores absolutos más grandes de Z indican una relación significativa. La fórmula es:

Notación

Término	Description
Z_i	El estadístico de prueba para una distribución normal estándar
	El coeficiente estimado
	El error estándar del coeficiente estimado

Para muestras pequeñas, la prueba de relación de probabilidades puede ser una prueba de significancia más fiable. Los valores p de relación de probabilidades están en la tabla Desviación. Cuando el tamaño de la muestra es lo suficientemente grande, los valores p de los estadísticos Z se aproximan a los valores p de los estadísticos de relación de probabilidades.

Valor p (P)

Se utilizan en las pruebas de hipótesis como ayuda para decidir si se puede rechazar o no una hipótesis nula. El valor p es la probabilidad de obtener un estadístico de prueba que sea por lo menos tan extremo como el valor real calculado, si la hipótesis nula es verdadera. Un valor de corte que se utiliza comúnmente para el valor p es 0.05. Por ejemplo, si el valor p calculado de un estadístico de prueba es menor que 0.05, usted rechaza la hipótesis nula.

Intervalo de confianza

El intervalo de confianza de un coeficiente estimado para una muestra grande es:

Para la regresión logística binaria, Minitab proporciona intervalos de confianza para las relaciones de probabilidades. Para obtener el intervalo de confianza de la relación de probabilidades, eleve a una potencia los límites inferior y superior del intervalo de confianza. El intervalo proporciona el rango en el que podrían situarse las probabilidades para cada cambio de una unidad en el predictor.

Notación

Término	Description
	el i^ésimo coeficiente
	la probabilidad acumulada inversa de la distribución normal estándar en
	el nivel de significancia
	el error estándar del coeficiente estimado

Matriz de varianzas-covarianzas

Una matriz de d x d, donde d es el número de predictores más uno. La varianza de cada coeficiente se encuentra en la celda diagonal y la covarianza de cada par de coeficientes se encuentra en la celda adecuada adyacente a la diagonal. La varianza es el error estándar del coeficiente elevado al cuadrado.

La matriz de varianzas-covarianzas se genera a partir de la última iteración de la inversa de la matriz de información. La matriz de varianzas-covarianzas tiene la siguiente forma:

W es una matriz diagonal donde los elementos diagonales vienen dados por la siguiente fórmula:

donde

Si se utiliza el enlace canónico, entonces la matriz hessiana observada y la matriz de información de Fisher son idénticas.

Notación

Término	Description
y_i	el valor de respuesta para la i^ésima fila
	la respuesta media estimada para la i^ésima fila
V(·)	la función de varianza especificada en la siguiente tabla
g(·)	la función de enlace
V '(·)	la primera derivada de la función de varianza
g'(·)	la primera derivada de la función de enlace
g''(·)	la segunda derivada de la función de enlace

La función de varianza depende del modelo:

Modelo	Función de varianza
Binomial
Poisson

Para obtener más información, véase [1] y [2].

[1] A. Agresti (1990). Categorical Data Analysis. John Wiley & Sons, Inc.

[2] P. McCullagh y J.A. Nelder (1992). Generalized Linear Model. Chapman & Hall.