Métodos y fórmulas para los estadísticos de bondad de ajuste en Ajustar modelo de regresión

Seleccione el método o la fórmula de su preferencia.

S

Notación

TérminoDescription
MSEcuadrado medio del error

R-cuad.

El R2 también es denominado como el coeficiente de determinación.

Fórmula

Notación

TérminoDescription
yi i ésimo valor de respuesta observado
respuesta media
i iésima respuesta ajustada

R-cuad.(ajustado)

Mientras que los cálculos de R2 ajustados pueden producir valores negativos, Minitab muestra el cero para estos casos.

Notación

TérminoDescription
iésimo valor de respuesta observado
iésima respuesta ajustada
respuesta media
nnúmero de observaciones
pnúmero de términos en el modelo

R-cuad.(pred)

Aunque los cálculos de R2(pred) pueden producir valores negativos, para estos casos Minitab muestra cero.

Notación

TérminoDescription
yi i ésimo valor de respuesta observado
respuesta media
n número de observaciones
ei i ésimo residuo
hi i ésimo elemento diagonal de X(X'X)–1X'
X matriz de diseño

PRESS

Evalúa la capacidad de predicción del modelo y se calcula de la siguiente manera:

Notación

TérminoDescription
nnúmero de observaciones
eiiésimo residuo
hi

iésimo elemento diagonal de

X (X' X)-1X'

S de prueba

S de prueba resume la distancia entre los valores de datos y los valores ajustados en el conjunto de datos de prueba. S de prueba se mide en las unidades de la respuesta.

Fórmula

donde

.

Para la regresión,

y para la regresión ponderada

.

Notación

TérminoDescription
number of rows in the test data set
i-ésima observed response value in the test data set
i-ésima fitted value for the response in the test data set
weight for the i-ésima observation in the test data set

R-cuad. de la prueba

R2 de la pruebaes el porcentaje de variación en la variable de respuesta del conjunto de datos de prueba que explica el modelo. El valor de R2 de la prueba oscila entre 0% y 100%. (Aunque los cálculos para la prueba R2 pueden producir valores negativos, Minitab Statistical Software muestra 0 para estos casos.)

Fórmula

donde para la regresión

y para la regresión ponderada

.

La fórmula para las sumas totales de cuadrados también depende de si los datos incluyen ponderaciones. Para la regresión,

y para la regresión ponderada
donde

Notación

TérminoDescription
number of rows in the test data set
i-ésima observed response value in the test data set
i-ésima fitted value for the response in the test data set
weight for the i-ésima observation in the test data set
mean of the response for the test data set
weighted mean of the response for the test data set

S de K pliegues

S de K pliegues resume la distancia entre los valores de datos y los valores ajustados en el conjunto de datos de prueba. S de K pliegues se mide en las unidades de la respuesta.

Fórmula

donde

.

Para la regresión,

y para la regresión ponderada

.

Notación

TérminoDescription
number of rows in fold j
i-ésima observed response value in fold j
i-ésima cross-validated fitted value for the response in fold j
Knumber of folds
wiweight for the i-ésima observation in fold j

R-cuad. de K pliegues

R2 de K pliegues es el porcentaje de variación en la variable de respuesta de los pliegues de datos que explica el modelo. El valor de R2 de K pliegues oscila entre 0% y 100%. (Aunque los cálculos para R2 de K pliegues pueden producir valores negativos, Minitab Statistical Software muestra 0 para estos casos.)

Fórmula

Minitab calcula la suma de cuadrados para el error para cada pliegue. Estos cálculos utilizan los mismos términos de modelo para cada pliegue, pero las estimaciones de los coeficientes pueden diferir. Para calcular la estadística de R2 de k pliegues, sume las sumas de cuadrados para el error de los diferentes pliegues. Para la regresión

y para la regresión ponderada

.

A continuación, la siguiente fórmula proporciona la ecuación para R2 de k pliegues:

Notación

TérminoDescription
number of rows without missing values for the response or missing values for the predictors that form the candidate terms in the model
i-ésima observed response value in fold j
i-ésima cross-validated fitted value for the response in fold j
Knumber of folds
wijweight for the i-ésima observation in fold j
SSTotaltotal sum of squares for all of the data

R-cuad. escalonado de K pliegues

R-cuad. escalonado de K pliegues evalúa el número de términos en un modelo a partir de un conjunto de términos candidatos. Minitab muestra valores negativos para R-cuad. escalonado de k pliegues cuando ocurren.

Fórmula

Minitab calcula R-cuad. escalonado de k pliegues cuando el método de selección escalonada es la selección hacia delante con validación y el método de validación es validación cruzada de k pliegues. Minitab realiza la selección hacia delante K veces, omitiendo los datos para cada pliegue una vez. El modelo para cada pliegue puede ser diferente. Una vez completados los procedimientos de selección hacia delante, Minitab suma los errores al cuadrado para todos los pliegues en cada paso. Minitab utiliza esta suma para calcular R-cuad. escalonado de k pliegues. Para la regresión:

y para la regresión ponderada:

Luego, la siguiente fórmula proporciona el valor de R2 escalonado de K pliegues para un paso.

Notación

TérminoDescription
number of rows without missing values for the response or missing values for the predictors that form the candidate terms in the model
i-ésima observed response value in fold j
i-ésima cross-validated fitted value for the response in fold j
Knumber of folds
wijweight for the i-ésima observation in fold j
SSTotaltotal sum of squares for all of the data

Log-verosimilitud

Para análisis no ponderados, Minitab utiliza la siguiente ecuación:
Para un análisis que tenga ponderaciones para las observaciones, Minitab utiliza la siguiente ecuación:

Las observaciones con ponderaciones de 0 no están en el análisis.

Notación

TérminoDescription
nel número de observaciones
Rla suma de los cuadrados para el error del modelo
wila ponderación de la iiésima observación

AICc (Criterio de información de Akaike corregido)

AICc no se calcula cuando .

Notación

TérminoDescription
nel número de observaciones
pel número de coeficientes en el modelo, incluida la constante

BIC (Criterio de información bayesiano)

Notación

TérminoDescription
pel número de coeficientes en el modelo, incluida la constante
nel número de observaciones

Cp de Mallows

Notación

TérminoDescription
SSEpsuma de errores cuadráticos para el modelo considerado
MSEmcuadrado medio del error para el modelo con todos los términos candidato
nnúmero de observaciones
pnúmero de términos en el modelo, incluyendo la constante
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política