Métodos y fórmulas para el resumen del modelo en Ajustar modelo logístico binario

Seleccione el método o la fórmula de su preferencia.

R2 de desviación

El R2 de desviación indica qué tanto de la variación en la respuesta es explicado por el modelo. Mientras mayor sea el R2, mejor se ajustará el modelo a los datos. La fórmula es:

Notación

TérminoDescription
DEError Deviance
DTTotal Deviance

R2 de desviación ajustado

El R2 de desviación ajustado explica el número de predictores incluidos en el modelo y es útil para comparar modelos con diferentes cantidades de predictores. La fórmula es:

Notación

TérminoDescription
R2el R2 de desviación
plos grados de libertad para la regresión
Φ1, para los modelos binomial y de Poisson
DTla desviación total

Aunque los cálculos del R2 de desviación ajustado pueden producir valores negativos, Minitab muestra cero para esos casos.

Criterio de información de Akaike (AIC)

Utilice este estadístico para comparar diferentes modelos. Mientras más pequeño sea el AIC, mejor se ajustará el modelo a los datos.

Las funciones de log-verosimilitud se parametrizan en términos de las medias. La siguiente es la forma general de las funciones:

La siguiente es la forma general de las contribuciones individuales:

La forma específica de las contribuciones individuales depende del modelo.

Modelo li
Binomial
Poisson

Notación

TérminoDescription
plos grados de libertad para la regresión
Lcla log-verosimilitud del modelo actual
yiel número de eventos para la iésima fila
miel número de ensayos para la iésima fila
la respuesta media estimada de la iésima fila

AICc (Criterio de información de Akaike corregido)

AICc no se calcula cuando .

Notación

TérminoDescription
pel número de coeficientes en el modelo, incluida la constante
nel número de filas en los datos con datos presentes

BIC (Criterio de información bayesiano)

Notación

TérminoDescription
pel número de coeficientes en el modelo, sin contar la constante
nel número de filas en los datos sin datos faltantes

R2 de la desviación de prueba

El R2 de la desviación de prueba indica cuánto de la variación en la respuesta del conjunto de datos de prueba explica el modelo. Cuanto mayor sea el valor, mejor se ajusta el modelo a los datos de prueba.

Fórmula

La siguiente ecuación proporciona la fórmula para el R2 de la desviación de prueba:

donde la siguiente ecuación representa la desviación del error:

y la siguiente ecuación representa la desviación total:
Para modelos con un término de intersección, tiene la siguiente definición:

Para modelos sin un término de intersección, = 0.5.

Notación

TérminoDescription
N(Test)the number of rows in the test data set
the squared deviance residuals
yithe number of events for the i-ésimo row in the test data set
mithe number of trials for the i-ésimo row in the test data set
DE(Test)the error deviance for the test data set
DT(Test)the total deviance for the test data set

Área bajo la curva ROC

Fórmula

Para el área debajo de la curva, Minitab utiliza una integración.

En la mayoría de los casos, esta integral es equivalente a la siguiente suma de áreas de trapecios:

donde k es el número de distintas probabilidades de evento y (x0, y0) es el punto (0, 0).

Por ejemplo, supongamos que tenemos cuatro probabilidades de evento distintas con las siguientes coordenadas en la curva ROC:
x (tasa de falsos positivos) y (tasa verdaderos positivos)
0.0923 0.3051
0.4154 0.7288
0.7538 0.9322
1 1
Luego, el área bajo la curva ROC se da por el siguiente cálculo:

Notación

TérminoDescription
TRP true positive rate
FPR false positive rate
TPtrue positive, events that were correctly assessed
P number of actual positive events
FPtrue negative, nonevents that were correctly assessed
N number of actual negative events
FNRfalse negative rate
TNRtrue negative rate
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política