Métodos y fórmulas para Regresión de mejores subconjuntos

Rutina de cálculo

En la regresión de los mejores subconjuntos, Minitab utiliza un procedimiento llamado "camino hamiltoniano", que es un método para calcular todos los subconjuntos posibles de predictores, un subconjunto por paso. Es decir, Minitab calcula todos los 2**m - 1 subconjuntos en 2**m - 1 pasos, donde m es el número de predictores incluidos en el modelo. Minitab evalúa una regresión de subconjunto diferente en cada paso.

Cada subconjunto en el camino hamiltoniano difiere del subconjunto anterior por la adición o la eliminación de solo una variable. El operador Sweep incluye o excluye una variable de la regresión en cada paso del camino hamiltoniano y calcula el R2 para cada subconjunto.

Ecuación de regresión

Para un modelo con múltiples predictores, la ecuación es:

y = β0 + β1x1 + … + βkxk + ε

La ecuación ajustada es:

En la regresión lineal simple, que incluye solo un predictor, el modelo es:

y=ß0+ ß1x1+ε

Utilizando las estimaciones de regresión b0 para ß0 y b1 para ß1, el ecuación ajustada es:

Notación

TérminoDescription
yrespuesta
xkkésimo término. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
ßkkésimo coeficiente de regresión de la población
εtérmino de error que sigue una distribución normal con una media de 0
kestimación del késimo coeficiente de regresión de la población
respuesta ajustada

R-cuad.

El R2 también es denominado como el coeficiente de determinación.

Fórmula

Notación

TérminoDescription
yi i ésimo valor de respuesta observado
respuesta media
i iésima respuesta ajustada

R-cuad.(ajustado)

Notación

TérminoDescription
CMCuadrado medio
SCSuma de los cuadrados
GLGrados de libertad

PRESS

Evalúa la capacidad de predicción del modelo y se calcula de la siguiente manera:

Notación

TérminoDescription
nnúmero de observaciones
eiiésimo residuo
hi

iésimo elemento diagonal de

X (X' X)-1X'

R-cuad.(pred)

Aunque los cálculos de R2(pred) pueden producir valores negativos, para estos casos Minitab muestra cero.

Notación

TérminoDescription
yi i ésimo valor de respuesta observado
respuesta media
n número de observaciones
ei i ésimo residuo
hi i ésimo elemento diagonal de X(X'X)–1X'
X matriz de diseño

Cp de Mallows

Notación

TérminoDescription
SSEpsuma de errores cuadráticos para el modelo considerado
MSEmcuadrado medio del error para el modelo con todos los predictores
nnúmero de observaciones
pnúmero de términos en el modelo, incluyendo la constante

S

Notación

TérminoDescription
MSEcuadrado medio del error
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política