Métodos y fórmulas para las medidas de diagnóstico en Ajustar modelo logístico binario

Seleccione el método o la fórmula de su preferencia.

Residuos de Pearson

Elementos de la chi-cuadrada de Pearson que se pueden utilizar para detectar patrones de factor/covariable mal ajustados. Minitab almacena el residuo de Pearson para el iésimo patrón de factor/covariable. La fórmula es:

Notación

TérminoDescription
yiel valor de respuesta para el iésimo patrón de factor/covariable
el valor ajustado para el iésimo patrón de factor/covariable
Vla función de varianza para el modelo en

La función de varianza depende del modelo:

Modelo Función de varianza
Binomial
Poisson

Residuos estandarizados y eliminados de Pearson

Se utilizan para detectar patrones de factor/covariable mal ajustados. Minitab almacena el residuo estandarizado de Pearson para el iésimo patrón de factor/covariable. Los residuos eliminados de Pearson también se conocen como los residuos de relación de probabilidades de Pearson. Para el residuo eliminado de Pearson, Minitab calcula la aproximación de un paso descrita en Pregibon.1 Esta aproximación es igual al residuo estandarizado de Pearson. La fórmula es:

Notación

TérminoDescription
el residuo de Pearson para el iésimo patrón de factor/covariable
1, para los modelos binomial y de Poisson
el apalancamiento para el iésimo patrón de factor/covariable

Residuos de Pearson estandarizados con validación

Para los datos de validación, el denominador de la fórmula para el residuo de Pearson estandarizado agrega el apalancamiento en lugar de restar el apalancamiento.

Fórmula

Notación

TérminoDescription
the Pearson residual for the i-ésimo validation row
1, for the binomial and Poisson models
the leverage for the i-ésimo validation row

Residuos de desviación

Los residuos de desviación se basan en la desviación del modelo y son útiles para identificar los patrones de factor/covariable mal ajustados. La desviación del modelo es un estadístico de bondad de ajuste basado en la función de log-verosimilitud. El residuo de desviación definido para el iésimo patrón de factor/covariable es:

Notación

TérminoDescription
yi el valor de respuesta para el iésimo patrón de factor/covariable
el valor ajustado para el iésimo patrón de factor/covariable
la desviación para el iésimo patrón de factor/covariable

Residuo estandarizado de desviación

El residuo de desviación estandarizado es útil para identificar los valores atípicos.. La fórmula es:

Notación

TérminoDescription
rD,iEl residuo de desviación para el iésimo patrón de factor/covariable
hiEl apalancamiento para el iésimo patrón de factor/covariable

Residuo de desviación estandarizado con validación

Para los datos de validación, el denominador de la fórmula para el residuo de desviación estandarizado agrega el apalancamiento en lugar de restar el apalancamiento.

Fórmula

Notación

TérminoDescription
rD,iThe deviance residual for the i-ésimo validation row
hiThe leverage for the i-ésimo validation row

Residuo de desviación eliminado

El residuo de desviación eliminado mide el cambio en la desviación debido a la omisión del caso iésimo de los datos. Los residuos de desviación eliminados también se conocen como residuos de desviación de relación de probabilidades. Para el residuo de desviación eliminado, Minitab calcula una aproximación de un paso con base en el método de aproximación de un paso de Pregibon1. La fórmula es la siguiente:

Notación

TérminoDescription
yiel valor de respuesta en el iésimo patrón de factor/covariable
el valor ajustado para el iésimo patrón de factor/covariable
hiel apalancamiento para el iésimo patrón de factor/covariable
r'D,iel residuo de desviación estandarizado para el iésimo patrón de factor/covariable
r'P,iel residuo estandarizado de Pearson para el iésimo patrón de factor/covariable

1. Pregibon, D. (1981). "Logistic Regression Diagnostics." The Annals of Statistics, Vol. 9, No. 4 pp. 705–724.

Delta chi-cuadrada

Minitab calcula el cambio en la chi-cuadrada de Pearson debido a la eliminación de todas las observaciones con el jésimo patrón de factor/covariable. Minitab almacena un valor de delta chi-cuadrada para cada patrón distinto de factor/covariable en los datos. El valor de delta chi-cuadrada se puede utilizar para detectar patrones de factor/covariable mal ajustados. La fórmula para delta chi-cuadrada es:

Fórmula

Notación

TérminoDescription
hj apalancamiento
rj Residuos de Pearson

Desviación delta

Minitab calcula el cambio en el estadístico de desviación eliminando todas las observaciones con el jésimo patrón de factor/covariable. Minitab almacena un valor para cada patrón distinto de factor/covariable en los datos. La desviación delta se puede utilizar para detectar patrones de factor/covariable mal ajustados. El cambio en el estadístico de desviación es:

Notación

TérminoDescription
hjapalancamiento
rjResiduos de Pearson
djresiduos de desviación

Delta beta (estandarizado)

Minitab calcula el cambio eliminando todas las observaciones con el jésimo patrón de factor/covariable. Se almacena un valor para cada patrón distinto de factor/covariable en los datos. Puede utilizar delta β estandarizado para detectar patrones de factor/covariable que tienen una gran influencia en las estimaciones de los coeficientes. Este valor se basa en el residuo estandarizado de Pearson.

Fórmula

Notación

TérminoDescription
hj apalancamiento
rs j residuos estandarizados de Pearson

Delta beta

Minitab calcula el cambio eliminando todas las observaciones con el jésimo patrón de factor/covariable. Se almacena un valor para cada patrón distinto de factor/covariable en los datos. Puede utilizar β para detectar patrones de factor/covariable que tengan gran influencia en las estimaciones de los coeficientes. Este valor se basa en el residuo de Pearson.

Fórmula

Notación

TérminoDescription
hj apalancamiento
rj Residuos de Pearson

Apalancamientos

Los apalancamientos son los elementos diagonales de la matriz de sombrero generalizada. Los apalancamientos son útiles para detectar patrones de factor/covariable que pueden tener una influencia significativa en los resultados.

Fórmula

Notación

TérminoDescription
wj el jésimo elemento diagonal de la matriz de ponderaciones obtenida del ajuste de los coeficientes
xjla jésima fila de la matriz de diseño
Xla matriz de diseño
X'la transpuesta de X
Wla matriz de ponderaciones obtenida de la estimación de los coeficientes

Apalancamientos con validación

Notación

TérminoDescription
wi the internal weight for the i-ésimo validation row
xithe row of the design matrix for the predictors in the i-ésimo validation row
Xthe design matrix for the training data set
X'the transpose of X
Wthe diagonal matrix of internal weights for the training data set

Distancia de Cook

Minitab calcula una distancia de Cook aproximada.

Fórmula

Notación

TérminoDescription
hiel apalancamiento para el iésimo patrón de factor/covariable
el residuo estandarizado de Pearson para el iésimo patrón de factor/covariable
plos grados de libertad para la regresión

DFITS

Una medida de la influencia de una sola supresión en los valores ajustados. Las observaciones con valores grandes de DFITS pueden ser valores atípicos. Minitab calcula un valor aproximado para DFITS.

Fórmula

Notación

TérminoDescription
hiEl apalancamiento para el punto de los datos
El residuo eliminado de Pearson para el punto de los datos

Factor de inflación de la varianza (FIV)

Para calcular un FIV, realice una regresión ponderada sobre el predictor con los predictores restantes. La matriz de ponderaciones es la que se proporciona en McCullagh y Nelder1 para la estimación de los coeficientes. En este caso, la fórmula de FIV es equivalente a la fórmula para una regresión lineal. Por ejemplo, para el predictor xj, la fórmula para el FIV es:

Notación

TérminoDescription
el coeficiente de determinación con xj como la variable de respuesta y los otros términos del modelo como los predictores

1. P. McCullagh y J. A. Nelder (1989). Generalized Linear Models, 2nd Edition, Chapman & Hall/CRC, London.