¿Qué es una regresión escalonada?

La regresión escalonada es una herramienta automatizada que se utiliza en las etapas exploratorias de la construcción de modelos para identificar un subconjunto útil de predictores. Este proceso agrega la variable más significativa o elimina la variable menos significativa de manera sistemática durante cada paso.

Por ejemplo, una empresa de consultoría inmobiliaria recoge datos sobre las ventas de viviendas en el año previo con la meta de predecir los precios de venta en el futuro. Con más de 100 variables predictoras, encontrar un modelo podría ser una tarea muy laboriosa. La función de regresión escalonada de Minitab identifica automáticamente una secuencia de modelos que se considerarán. Estadísticos tales como AICc, BIC, R2, R2 ajustado, R2 pronosticado, S y Cp de Mallows le ayudan a comparar modelos. Minitab muestra los resultados completos del mejor modelo de acuerdo con el procedimiento escalonado que usted use.

Procedimientos comunes de regresión escalonada

  • La regresión escalonada estándar agrega y elimina predictores según sea necesario en cada paso. Minitab se detiene cuando todas las variables que no están en el modelo poseen valores p mayores que el valor "alfa para ingresar" especificado y cuando todas las variables incluidas en el modelo tienen valores p que son menores que o iguales al valor "alfa para retirar" especificado.
  • La selección de criterio de información hacia adelante comienza con un modelo vacío y Minitab agrega el término que tiene el valor p más bajo en cada paso. Minitab se detiene cuando el modelo usa todos los grados de libertad o cuando no hay más términos que agregar. Los resultados del modelo que Minitab presenta corresponden al modelo con el valor mínimo del criterio de información que usted seleccionó en el procedimiento. Este criterio de información es AICc o BIC. El modelo más grande del paso final no tiene necesariamente el valor más bajo del criterio.
  • La selección hacia adelante comienza con un modelo vacío y Minitab agrega el término más significativo de cada paso. Minitab se detiene cuando todas las variables que no están en el modelo poseen valores p que son mayores que el valor "alfa para ingresar" especificado.
  • La eliminación hacia atrás comienza con todos los predictores incluidos en el modelo y Minitab retira la variable menos significativa de cada paso. Minitab se detiene cuando todas las variables del modelo tienen valores p que son menores que o iguales al valor "alfa para ingresar" especificado.

Problemas con la regresión escalonada

  • Si dos variables predictoras están muy correlacionadas, solo se podrá incluir una de ellas en el modelo aunque las dos pudieran ser importantes.
  • Puesto que el procedimiento ajusta muchos modelos, podría seleccionar modelos que se ajusten adecuadamente a los datos únicamente en virtud de las probabilidades.
  • La regresión escalonada pudiera no siempre terminar con el modelo que tiene el mejor valor de cualquier criterio dado para un conjunto dado de predictores.
  • Los procedimientos automáticos no pueden considerar el conocimiento especial que el analista pudiera tener acerca de los datos. Por lo tanto, el modelo seleccionado pudiera no ser el mejor desde el punto de vista práctico.
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política