Consideraciones acerca de los datos para Regresión de cuadrados mínimos parciales

Para asegurar que los resultados sean válidos, considere las siguientes pautas al recopilar datos, realizar el análisis e interpretar los resultados.

No es necesario que los predictores sean fijos
PLS no presupone que los predictores son fijos, lo que significa que los predictores pueden medirse con error. Si los predictores son fijos y no tienen error de medición considerable, utilice Ajustar modelo de regresión.
Los datos pueden tener más términos que observaciones o los predictores pueden ser altamente colineales
Si los predictores no son altamente colineales y los datos incluyen más observaciones que el número de predictores, utilice Ajustar modelo de regresión.
Los predictores pueden ser continuos o categóricos

Una variable continua puede medirse y ordenarse y tiene un número infinito de valores entre dos valores cualesquiera. Por ejemplo, los diámetros de una muestra de neumáticos es una variable continua.

Las variables categóricas contienen un número finito y contable de categorías o grupos distintos. Los datos categóricos pueden no tener un orden lógico. Por ejemplo, los predictores categóricos incluyen sexo, tipo de material y método de pago.

Si usted tiene una variable discreta, puede decidir si la tratará como un predictor continuo o categórico. Una variable discreta puede medirse y ordenarse, pero tiene un número contable de valores. Por ejemplo, el número de personas que viven en un hogar es una variable discreta. La decisión de tratar una variable discreta como continua o categórica depende del número de niveles, así como del propósito del análisis. Para obtener más información, vaya a ¿Qué son variables categóricas, discretas y continuas?.

Las variables de respuesta deben ser continuas

Si usted realiza el análisis con variables de respuesta correlacionadas, PLS puede detectar patrones de respuestas multivariadas y relaciones más débiles de lo que es posible con un análisis por separado para cada respuesta.

Si la variable de respuesta es categórica, es menos probable que el modelo cumpla con los supuestos del análisis, que describa con exactitud los datos o que haga predicciones útiles.

Si los predictores no están muy correlacionados y usted no tiene más predictores que observaciones, puede considerar los siguientes análisis alternativos.

  • Si la variable de respuesta tiene dos categorías, como pasa y no pasa, utilice Ajustar modelo logístico binario.
  • Si la variable de respuesta contiene tres o más categorías que tienen un orden natural, como por ejemplo completamente en desacuerdo, en desacuerdo, neutral, de acuerdo, completamente de acuerdo, utilice Regresión logística ordinal.
  • Si la variable de respuesta contiene tres o más categorías que no tienen un orden natural, como por ejemplo raya, hendidura y rotura, utilice Regresión logística nominal.
  • Si la variable de respuesta cuenta ocurrencias, tales como el número de defectos, utilice Ajustar modelo de Poisson.
Recolecte los datos utilizando las mejores prácticas
Para asegurar que los resultados sean válidos, considere las siguientes pautas:
  • Asegúrese de que los datos representen a la población de interés.
  • Recolecte suficiente datos para proporcionar la precisión necesaria.
  • Mida las variables con tanta exactitud y precisión como sea posible.
  • Registre los datos en el orden de recolección.
El modelo debe proveer un ajuste adecuado a los datos

Si el modelo no se ajusta a los datos, los resultados pueden ser engañosos. En la salida, utilice las gráficas de residuos, los estadísticos de selección y validación del modelo y la gráfica de respuesta para determinar qué tan bien se ajusta el modelo a los datos.