¿Qué es una regresión escalonada?

La regresión escalonada es una herramienta automatizada que se utiliza en las etapas exploratorias de la construcción de modelos para identificar un subconjunto útil de predictores. Este proceso agrega la variable más significativa o elimina la variable menos significativa de manera sistemática durante cada paso.

Por ejemplo, una empresa de consultoría inmobiliaria recoge datos sobre las ventas de viviendas en el año previo con la meta de predecir los precios de venta en el futuro. Con más de 100 variables predictoras, encontrar los modelos más significativos podría ser una tarea muy laboriosa. La función de regresión escalonada de Minitab genera automáticamente los modelos más significativos junto con R2, R2 ajustado, R2 pronosticado, S y Cp de Mallows, ofreciendo un primer paso bastante efectivo.

Procedimientos comunes de regresión escalonada

  • La regresión escalonada estándar agrega y elimina predictores según sea necesario en cada paso. Minitab se detiene cuando todas las variables que no están en el modelo poseen valores p mayores que el valor "alfa para ingresar" especificado y cuando todas las variables incluidas en el modelo tienen valores p que son menores que o iguales al valor "alfa para retirar" especificado.
  • La selección hacia adelante comienza con un modelo vacío y Minitab agrega el término más significativo de cada paso. Minitab se detiene cuando todas las variables que no están en el modelo poseen valores p que son mayores que el valor "alfa para ingresar" especificado.
  • La eliminación hacia atrás comienza con todos los predictores incluidos en el modelo y Minitab retira la variable menos significativa de cada paso. Minitab se detiene cuando todas las variables del modelo tienen valores p que son menores que o iguales al valor "alfa para ingresar" especificado.

Problemas con la regresión escalonada

  • Si dos variables predictoras están muy correlacionadas, solo se podrá incluir una de ellas en el modelo aunque las dos pudieran ser importantes.
  • Puesto que el procedimiento ajusta muchos modelos, podría seleccionar modelos que se ajusten adecuadamente a los datos únicamente en virtud de las probabilidades.
  • La regresión escalonada pudiera no siempre terminar con el modelo que tiene el valor de R2 más alto posible para un número especificado de predictores.
  • Los procedimientos automáticos no pueden considerar el conocimiento especial que el analista pudiera tener acerca de los datos. Por lo tanto, el modelo seleccionado pudiera no ser el mejor desde el punto de vista práctico.
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política