Métodos y fórmulas para Regresión de los mejores subconjuntos

En este tema

Rutina de cálculo
Ecuación de regresión
R-cuad.
R-cuad.(ajustado)
PRESS
R-cuad.(pred)
Cp de Mallows
S
Log-verosimilitud
AICc (Criterio de información de Akaike corregido)
BIC (Criterio de información bayesiano)
Número de condición

Rutina de cálculo

En la regresión de los mejores subconjuntos, Minitab utiliza un procedimiento llamado "camino hamiltoniano", que es un método para calcular todos los subconjuntos posibles de predictores, un subconjunto por paso. Es decir, Minitab calcula todos los 2**m - 1 subconjuntos en 2**m - 1 pasos, donde m es el número de predictores incluidos en el modelo. Minitab evalúa una regresión de subconjunto diferente en cada paso.

Cada subconjunto en el camino hamiltoniano difiere del subconjunto anterior por la adición o la eliminación de solo una variable. El operador Sweep incluye o excluye una variable de la regresión en cada paso del camino hamiltoniano y calcula el R² para cada subconjunto.

Ecuación de regresión

Para un modelo con múltiples predictores, la ecuación es:

y = β₀ + β₁x₁ + … + β_kx_k + ε

La ecuación ajustada es:

En la regresión lineal simple, que incluye solo un predictor, el modelo es:

y=ß₀+ ß₁x₁+ε

Utilizando las estimaciones de regresión b₀ para ß₀ y b₁ para ß₁, el ecuación ajustada es:

Notación

Término	Description
y	respuesta
x_k	k^ésimo término. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
ß_k	k^ésimo coeficiente de regresión de la población
ε	término de error que sigue una distribución normal con una media de 0
k	estimación del k^ésimo coeficiente de regresión de la población
	respuesta ajustada

R-cuad.

El R² también es denominado como el coeficiente de determinación.

Fórmula

Notación

Término	Description
y_i	i ^ésimo valor de respuesta observado
	respuesta media
	i ^iésima respuesta ajustada

R-cuad.(ajustado)

Notación

Término	Description
CM	Cuadrado medio
SC	Suma de los cuadrados
GL	Grados de libertad

PRESS

Evalúa la capacidad de predicción del modelo y se calcula de la siguiente manera:

Notación

Término	Description
n	número de observaciones
e_i	i^ésimo residuo
h_i	i^ésimo elemento diagonal de X (X' X)^-1X'

Término

Description

número de observaciones

e_i

i^ésimo residuo

h_i

i^ésimo elemento diagonal de

X (X' X)^-1X'

R-cuad.(pred)

Aunque los cálculos de R²(pred) pueden producir valores negativos, para estos casos Minitab muestra cero.

Notación

Término	Description
y_i	i ^ésimo valor de respuesta observado
	respuesta media
n	número de observaciones
e_i	i ^ésimo residuo
h_i	i ^ésimo elemento diagonal de X(X'X)^–1X'
X	matriz de diseño

Cp de Mallows

Notación

Término	Description
SSE_p	suma de errores cuadráticos para el modelo considerado
MSE_m	cuadrado medio del error para el modelo con todos los términos candidato
n	número de observaciones
p	número de términos en el modelo, incluyendo la constante

S

Notación

Término	Description
MSE	cuadrado medio del error

Log-verosimilitud

Para análisis no ponderados, Minitab utiliza la siguiente ecuación:

Para un análisis que tenga ponderaciones para las observaciones, Minitab utiliza la siguiente ecuación:

Las observaciones con ponderaciones de 0 no están en el análisis.

Notación

Término	Description
n	el número de observaciones
R	la suma de los cuadrados para el error del modelo
w_i	la ponderación de la i^iésima observación

AICc (Criterio de información de Akaike corregido)

AICc no se calcula cuando .

Notación

Término	Description
n	el número de observaciones
p	el número de coeficientes en el modelo, incluida la constante

BIC (Criterio de información bayesiano)

Notación

Término	Description
p	el número de coeficientes en el modelo, incluida la constante
n	el número de observaciones

Número de condición

Notación

Término	Description
C	el número de condición
λ_máximo	el máximo valor propio de la matriz de correlación de los términos en el modelo, sin incluir la intersección
λ_mínimo	el mínimo valor propio de la matriz de correlación de los términos en el modelo, sin incluir la intersección