Métodos y fórmulas para Predecir

Seleccione el método o la fórmula de su preferencia.

Intervalo de confianza

El rango en el que se espera que se encuentre la respuesta media estimada para un conjunto dado de valores de predictor.

Fórmula

Notación

TérminoDescription
valor de respuesta ajustado para un conjunto dado de valores de predictor
αtasa de error de tipo I
nnúmero de observaciones
pnúmero de parámetros del modelo
S 2(b)matriz de varianzas-covarianzas de los coeficientes
s 2cuadrado medio del error
Xmatriz de diseño
X0vector de valores dados de predictor con 1 columna y p filas
X'0transposición del nuevo vector de valores de predictor con 1 fila y p columnas

Ajuste

Notación

TérminoDescription
valor ajustado
xkkésimo término. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
kestimación del késimo coeficiente de regresión

Error estándar del valor ajustado (EE ajuste)

El error estándar del valor ajustado en un modelo de regresión con un predictor es:

El error estándar del valor ajustado en un modelo de regresión con más de un predictor es:

Para la regresión ponderada, incluya la matriz de peso en la ecuación:

Cuando los datos tienen un conjunto de datos de prueba o una validación cruzada k-fold, las fórmulas son las mismas. El valor de s2 es de los datos de entrenamiento. La matriz de diseño y la matriz de peso también provienen de los datos de entrenamiento.

Notación

TérminoDescription
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xii-ésimo predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Ecuación de regresión

Para un modelo con múltiples predictores, la ecuación es:

y = β0 + β1x1 + ... + βkxk + ε

La ecuación ajustada es:

En la regresión lineal simple, que incluye solo un predictor, el modelo es:

y=ß0+ ß1x1+ε

Usando estimaciones de regresión b0 para ß0y b1 para ß1, la ecuación ajustada es:

Ecuaciones con una variable categórica

Cuando se incluye una variable categórica en un modelo de regresión, hay 2 opciones para mostrar la ecuación de regresión:
  • Ecuación separada de cada conjunto de niveles predictores categóricos
  • Una sola ecuación
Estas dos opciones son equivalentes. Por ejemplo, supongamos que los datos tienen las siguientes variables:
C1
La variable respuesta
C2
Un predictor continuo
C3
Una variable predictora categórica con los niveles Rojo y Azul
Las ecuaciones separadas son las siguientes:
  • Azul: C1 = 0,184 + 0,1964*C2
  • Rojo: C1 = 0,011 + 0,1964*C2

Una sola ecuación utiliza una variable indicadora para representar la variable categórica.

C1 = 0,184 + 0,1964*C2 + 0,0*C3_Azul- 0,173*C3_Rojo

En la ecuación única, C3_Azul es igual a 1 si la observación es azul, y 0 en caso contrario. C3_Rojo es igual a 1 si la observación es roja, y 0 en caso contrario. Para cada grupo, sustituyamos la variable indicadora para verificar que la ecuación individual es la misma que las dos ecuaciones separadas.
  • Observación azul (C3_Azul = 1, C3_Rojo = 0): C1 = 0,184 + 0,1964*C2 + 0,0*1 - 0,173*0 = 0,184 + 0,1964*C2
  • Observación roja (C3_Azul = 0, C3_Rojo = 1: C1 = 0,084 + 0,1964*C2 + 0,0*0 - 0,173*1 = 0,011 + 0,1964*C2

Notación

TérminoDescription
yRespuesta
xkOk-ésimo trimestre. Cada término puede ser un solo predictor, un término polinómico o un término de interacción.
ßkkésimo coeficiente de regresión poblacional
εtérmino de error que sigue una distribución normal con una media de 0
bkEstimación del coeficiente de regresión poblacional késimo
respuesta ajustada

Intervalo de predicción

El intervalo de predicción es el rango en el que se espera que se encuentre la respuesta ajustada para una nueva observación.

Fórmula

Notación

TérminoDescription
s(Pred)
valor de respuesta ajustado para un conjunto dado de valores predictores
αnivel de significancia
nnúmero de observaciones
pnúmero de parámetros del modelo
s 2cuadrado medio del error
Xmatriz de predictores
X0vector de valores dados de predictor con 1 columna y p filas
X'0transposición del nuevo vector de valores de predictor con 1 fila y p columnas