Métodos y fórmulas para Predecir

Seleccione el método o la fórmula de su preferencia.

En este tema

Intervalo de confianza
Ajuste
Error estándar del valor ajustado (EE ajuste)
Ecuación de regresión
Intervalo de predicción

Intervalo de confianza

El rango en el que se espera que se encuentre la respuesta media estimada para un conjunto dado de valores de predictor.

Fórmula

Notación

Término	Description

	valor de respuesta ajustado para un conjunto dado de valores de predictor
α	tasa de error de tipo I
n	número de observaciones
p	número de parámetros del modelo
S ²(b)	matriz de varianzas-covarianzas de los coeficientes
s ²	cuadrado medio del error
X	matriz de diseño
X₀	vector de valores dados de predictor con 1 columna y p filas
X'₀	transposición del nuevo vector de valores de predictor con 1 fila y p columnas

Ajuste

Notación

Término	Description
	valor ajustado
x_k	k^ésimo término. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
k	estimación del k^ésimo coeficiente de regresión

Error estándar del valor ajustado (EE ajuste)

El error estándar del valor ajustado en un modelo de regresión con un predictor es:

El error estándar del valor ajustado en un modelo de regresión con más de un predictor es:

Para la regresión ponderada, incluya la matriz de peso en la ecuación:

Cuando los datos tienen un conjunto de datos de prueba o una validación cruzada k-fold, las fórmulas son las mismas. El valor de s² es de los datos de entrenamiento. La matriz de diseño y la matriz de peso también provienen de los datos de entrenamiento.

Notación

Término	Description
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^-ésimo predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

Ecuación de regresión

Para un modelo con múltiples predictores, la ecuación es:

y = β₀ + β₁x₁ + ... + β_kx_k + ε

La ecuación ajustada es:

En la regresión lineal simple, que incluye solo un predictor, el modelo es:

y=ß₀+ ß₁x₁+ε

Usando estimaciones de regresión b₀ para ß₀y b₁ para ß₁, la ecuación ajustada es:

Ecuaciones con una variable categórica

Cuando se incluye una variable categórica en un modelo de regresión, hay 2 opciones para mostrar la ecuación de regresión:

Ecuación separada de cada conjunto de niveles predictores categóricos
Una sola ecuación

Estas dos opciones son equivalentes. Por ejemplo, supongamos que los datos tienen las siguientes variables:

C1: La variable respuesta
C2: Un predictor continuo
C3: Una variable predictora categórica con los niveles Rojo y Azul

Las ecuaciones separadas son las siguientes:

Azul: C1 = 0,184 + 0,1964*C2
Rojo: C1 = 0,011 + 0,1964*C2

Una sola ecuación utiliza una variable indicadora para representar la variable categórica.

C1 = 0,184 + 0,1964*C2 + 0,0*C3_Azul- 0,173*C3_Rojo

En la ecuación única, C3_Azul es igual a 1 si la observación es azul, y 0 en caso contrario. C3_Rojo es igual a 1 si la observación es roja, y 0 en caso contrario. Para cada grupo, sustituyamos la variable indicadora para verificar que la ecuación individual es la misma que las dos ecuaciones separadas.

Observación azul (C3_Azul = 1, C3_Rojo = 0): C1 = 0,184 + 0,1964*C2 + 0,0*1 - 0,173*0 = 0,184 + 0,1964*C2
Observación roja (C3_Azul = 0, C3_Rojo = 1: C1 = 0,084 + 0,1964*C2 + 0,0*0 - 0,173*1 = 0,011 + 0,1964*C2

Notación

Término	Description
y	Respuesta
x_k	^Ok-ésimo trimestre. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
ß_k	k^ésimo coeficiente de regresión poblacional
ε	término de error que sigue una distribución normal con una media de 0
b_k	Estimación del coeficiente de regresión poblacional k^ésimo
	respuesta ajustada

Intervalo de predicción

El intervalo de predicción es el rango en el que se espera que se encuentre la respuesta ajustada para una nueva observación.

Fórmula

Notación

Término	Description
s(Pred)
	valor de respuesta ajustado para un conjunto dado de valores predictores
α	nivel de significancia
n	número de observaciones
p	número de parámetros del modelo
s ²	cuadrado medio del error
X	matriz de predictores
X₀	vector de valores dados de predictor con 1 columna y p filas
X'₀	transposición del nuevo vector de valores de predictor con 1 fila y p columnas