Consideraciones sobre los datos para Ajustar modelo de regresióny Regresión lineal

Ajustar modelo de regresión y Regresión lineal realizar el mismo análisis desde diferentes menús. Para asegurarse de que los resultados sean válidos, tenga en cuenta las siguientes directrices al recopilar datos, realizar el análisis e interpretar los resultados.

Los predictores pueden ser continuos o categóricos

Una variable continua se puede medir y ordenar, y tiene un número infinito de valores entre dos valores cualesquiera. Por ejemplo, los diámetros de una muestra de llantas son una variable continua.

Las variables categóricas contienen un número finito y contable de categorías o grupos distintos. Los datos categóricos pueden no tener un orden lógico. Por ejemplo, los predictores categóricos incluyen sexo, tipo de material y método de pago.

Si usted tiene una variable discreta, puede decidir si la tratará como un predictor continuo o categórico. Una variable discreta puede medirse y ordenarse, pero tiene un número contable de valores. Por ejemplo, el número de personas que viven en un hogar es una variable discreta. La decisión de tratar una variable discreta como continua o categórica depende del número de niveles, así como del propósito del análisis. Para obtener más información, vaya a ¿Qué son variables categóricas, discretas y continuas?.

La variable de respuesta debe ser continua
Si la variable de respuesta es categórica, es menos probable que el modelo cumpla con los supuestos del análisis, que describa con exactitud los datos o que haga predicciones útiles.
  • Si la variable de respuesta tiene dos categorías, como pasa y no pasa, utilice Ajustar modelo logístico binario.
  • Si la variable de respuesta contiene tres o más categorías que tienen un orden natural, como por ejemplo completamente en desacuerdo, en desacuerdo, neutral, de acuerdo, completamente de acuerdo, utilice Regresión logística ordinal.
  • Si la variable de respuesta contiene tres o más categorías que no tienen un orden natural, como por ejemplo raya, hendidura y rotura, utilice Regresión logística nominal.
  • Si la variable de respuesta cuenta ocurrencias, tales como el número de defectos, utilice Ajustar modelo de Poisson.
Recolecte los datos utilizando las mejores prácticas
Para asegurar que los resultados sean válidos, considere las siguientes pautas:
  • Asegúrese de que los datos representen a la población de interés.
  • Recolecte suficiente datos para proporcionar la precisión necesaria.
  • Mida las variables con tanta exactitud y precisión como sea posible.
  • Registre los datos en el orden de recolección.
La correlación entre los predictores, también conocida como multicolinealidad, no debe ser severa

Si la multicolinealidad es severa, es probable que usted no pueda determinar cuáles predictores incluir en el modelo. Para determinar la severidad de la multicolinealidad, utilice los factores de inflación de la varianza (FIV) indicados en la tabla Coeficientes de la salida.

El modelo debe proveer un ajuste adecuado a los datos

Si el modelo no se ajusta a los datos, los resultados pueden ser engañosos. En la salida, utilice las gráficas de residuos, los estadísticos de diagnóstico para observaciones poco comunes y los estadísticos de resumen del modelo para determinar qué tan bien se ajusta el modelo a los datos.