Métodos y fórmulas para las estadísticas de bondad de ajuste en Ajustar modelo de regresióny Regresión lineal

Seleccione el método o la fórmula de su preferencia.

S

Notación

TérminoDescription
MSEcuadrado medio del error

R-cuad.

El R2 también es denominado como el coeficiente de determinación.

Fórmula

Notación

TérminoDescription
yi i ésimo valor de respuesta observado
respuesta media
i iésima respuesta ajustada

R-cuad.(ajustado)

Mientras que los cálculos de R2 ajustados pueden producir valores negativos, Minitab muestra el cero para estos casos.

Notación

TérminoDescription
iésimo valor de respuesta observado
iésima respuesta ajustada
respuesta media
nnúmero de observaciones
pnúmero de términos en el modelo

R-cuad.(pred)

Aunque los cálculos de R2(pred) pueden producir valores negativos, para estos casos Minitab muestra cero.

Notación

TérminoDescription
yi i ésimo valor de respuesta observado
respuesta media
n número de observaciones
ei i ésimo residuo
hi i ésimo elemento diagonal de X(X'X)–1X'
X matriz de diseño

PRESS

Evalúa la capacidad de predicción del modelo y se calcula de la siguiente manera:

Notación

TérminoDescription
nnúmero de observaciones
eiiésimo residuo
hi

iésimo elemento diagonal de

X (X' X)-1X'

S de prueba

S de prueba resume la distancia entre los valores de datos y los valores ajustados en el conjunto de datos de prueba. S de prueba se mide en las unidades de la respuesta.

Fórmula

donde

.

Para la regresión,

y para la regresión ponderada

.

Notación

TérminoDescription
número de filas en el conjunto de datos de prueba
i-ésimo valor de respuesta observado en el conjunto de datos de prueba
iésimo valor ajustado para la respuesta en el conjunto de datos de prueba
ponderación para la i-ésima observación en el conjunto de datos de prueba

R-cuad. de prueba

El R2 de prueba es el porcentaje de variación en la variable de respuesta del conjunto de datos de prueba que explica el modelo. El valor de R2 de prueba oscila entre 0% y 100%. (Aunque los cálculos del R2 de prueba pueden producir valores negativos, Minitab Statistical Software muestra 0 para estos casos.)

Fórmula

donde para la regresión

y para la regresión ponderada

.

La fórmula para las sumas totales de cuadrados también depende de si los datos incluyen ponderaciones. Para la regresión,

y para la regresión ponderada
donde

Notación

TérminoDescription
número de filas en el conjunto de datos de prueba
i-ésimo valor de respuesta observado en el conjunto de datos de prueba
iésimo valor ajustado para la respuesta en el conjunto de datos de prueba
ponderación para la i-ésima observación en el conjunto de datos de prueba
media de la respuesta para el conjunto de datos de prueba
media ponderada de la respuesta para el conjunto de datos de prueba

S de K pliegues

S de K pliegues resume la distancia entre los valores de datos y los valores ajustados en el conjunto de datos de prueba. S de K pliegues se mide en las unidades de la respuesta.

Fórmula

donde

.

Para la regresión,

y para la regresión ponderada

.

Notación

TérminoDescription
número de filas en el pliegue j
i-ésimo valor de respuesta observado en el pliegue j
i-ésimo valor ajustado con validación cruzada para la respuesta en pliegue j
Knúmero de pliegues
wiponderación para la i-ésima observación en el pliegue j

R-cuad. de K pliegues

R2 de K pliegues es el porcentaje de variación en la variable de respuesta de los pliegues de datos que explica el modelo. El valor de R2 de K pliegues oscila entre 0% y 100%. (Aunque los cálculos para R2 de K pliegues pueden producir valores negativos, Minitab Statistical Software muestra 0 para estos casos.)

Fórmula

Minitab calcula la suma de cuadrados para el error para cada pliegue. Estos cálculos utilizan los mismos términos de modelo para cada pliegue, pero las estimaciones de los coeficientes pueden diferir. Para calcular la estadística de R2 de k pliegues, sume las sumas de cuadrados para el error de los diferentes pliegues. Para la regresión

y para la regresión ponderada

.

A continuación, la siguiente fórmula proporciona la ecuación para R2 de k pliegues:

Notación

TérminoDescription
número de filas sin valores faltantes para la respuesta o valores faltantes para los predictores que forman los términos candidatos en el modelo
i-ésimo valor de respuesta observado en el pliegue j
i-ésimo valor ajustado con validación cruzada para la respuesta en pliegue j
Knúmero de pliegues
wijponderación para la i-ésima observación en el pliegue j
SCTotalLa suma total de cuadrados para todos los datos

R-cuad. escalonado de K pliegues

R-cuad. escalonado de K pliegues evalúa el número de términos en un modelo a partir de un conjunto de términos candidatos. Minitab muestra valores negativos para R-cuad. escalonado de k pliegues cuando ocurren.

Fórmula

Minitab calcula R-cuad. escalonado de k pliegues cuando el método de selección escalonada es la selección hacia delante con validación y el método de validación es validación cruzada de k pliegues. Minitab realiza la selección hacia delante K veces, omitiendo los datos para cada pliegue una vez. El modelo para cada pliegue puede ser diferente. Una vez completados los procedimientos de selección hacia delante, Minitab suma los errores al cuadrado para todos los pliegues en cada paso. Minitab utiliza esta suma para calcular el R-cuad. escalonado de k pliegues. Para la regresión:

y para la regresión ponderada:

Luego, la siguiente fórmula proporciona el valor de R2 escalonado de K pliegues para un paso.

Notación

TérminoDescription
número de filas sin valores faltantes para la respuesta o valores faltantes para los predictores que forman los términos candidatos en el modelo
i-ésimo valor de respuesta observado en el pliegue j
i-ésimo valor ajustado con validación cruzada para la respuesta en pliegue j
Knúmero de pliegues
wijponderación para la i-ésima observación en el pliegue j
SCTotalLa suma total de cuadrados para todos los datos

Log-verosimilitud

Para análisis no ponderados, Minitab utiliza la siguiente ecuación:
Para un análisis que tenga ponderaciones para las observaciones, Minitab utiliza la siguiente ecuación:

Las observaciones con ponderaciones de 0 no están en el análisis.

Notación

TérminoDescription
nel número de observaciones
Rla suma de los cuadrados para el error del modelo
wila ponderación de la iiésima observación

AICc (Criterio de información de Akaike corregido)

AICc no se calcula cuando .

Notación

TérminoDescription
nel número de observaciones
pel número de coeficientes en el modelo, incluida la constante

BIC (Criterio de información bayesiano)

Notación

TérminoDescription
pel número de coeficientes en el modelo, incluida la constante
nel número de observaciones

Cp de Mallows

Notación

TérminoDescription
SSEpsuma de errores cuadráticos para el modelo considerado
MSEmcuadrado medio del error para el modelo con todos los términos candidato
nnúmero de observaciones
pnúmero de términos en el modelo, incluyendo la constante