Comparación de la regresión de los mejores subconjuntos con la regresión escalonada

La regresión de los mejores subconjuntos ofrece información sobre el ajuste de varios modelos diferentes, permitiéndole seleccionar un modelo con base en cuatro estadísticos diferentes. La regresión escalonada produce un solo modelo basado en un solo estadístico. Puesto que se utilizan criterios de selección diferentes en cada modelo, es posible que la regresión de los mejores subconjuntos y la regresión escalonada conduzcan a modelos diferentes. Las siguientes son las directrices generales para seleccionar el método que se usará:
  • Para los conjuntos de datos con un número pequeño de predictores, la regresión de los mejores subconjuntos es mejor que la regresión escalonada, porque ofrece información sobre más modelos.
  • Los mejores subconjuntos solo permiten tener 31 predictores libres, así que para conjuntos de datos con un gran número de predictores, la regresión escalonada es mejor que la regresión de los mejores subconjuntos. Cuando utilice la regresión escalonada con un conjunto de datos que tenga un gran número de predictores, elija niveles grandes de alfa a entrar y alfa a retirar (de 0.25 a 0.50). Esto permite obtener más información sobre los efectos de cada predictor ingresado sobre la respuesta y sobre los predictores que ya se encuentran en el modelo.

Verificación del modelo

Debe tener precaución al usar procedimientos de selección de variables tales como la regresión de los mejores subconjuntos y la regresión escalonada. Estos procedimientos son automáticos y, por lo tanto, no consideran la importancia práctica de ninguno de los predictores. Además, cada vez que usted ajusta un modelo a los datos, la bondad del ajuste proviene de dos fuentes principales:
  • La estructura subyacente de los datos (una estructura que se aplicará a otros conjuntos de datos recopilados de la misma manera)
  • Las peculiaridades del conjunto de datos específico que usted analiza

Para asegurarse de que el modelo no se ajuste únicamente a un conjunto específico de datos, deberá comprobar el modelo hallado por el procedimiento de selección con un nuevo conjunto de datos. También puede tomar el conjunto de datos original, dividirlo aleatoriamente en dos partes, usar los mejores subconjuntos con una parte para seleccionar un modelo y luego verificar el ajuste con la segunda parte. Esto ayudará a asegurar que el modelo seleccionado se aplique a otros conjuntos de datos recogidos de la misma manera.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política