Consideraciones acerca de los datos para Ajustar modelo logístico binario

Para asegurarse de que los resultados sean válidos, tenga en cuenta las siguientes directrices al recopilar datos, realizar el análisis e interpretar los resultados.

Los predictores pueden ser continuos o categóricos

Una variable continua se puede medir y ordenar, y tiene un número infinito de valores entre dos valores cualquiera. Por ejemplo, los diámetros de una muestra de neumáticos son una variable continua.

Las variables categóricas contienen un número finito y contable de categorías o grupos distintos. Los datos categóricos pueden no tener un orden lógico. Por ejemplo, los predictores categóricos incluyen sexo, tipo de material y método de pago.

Si usted tiene una variable discreta, puede decidir si la tratará como un predictor continuo o categórico. Una variable discreta puede medirse y ordenarse, pero tiene un número contable de valores. Por ejemplo, el número de personas que viven en un hogar es una variable discreta. La decisión de tratar una variable discreta como continua o categórica depende del número de niveles, así como del propósito del análisis. Para obtener más información, vaya a ¿Qué son variables categóricas, discretas y continuas?.

Si usted tiene predictores categóricos que están anidados o son aleatorios, utilice Ajustar modelo lineal general si todos los factores son fijos o Ajustar modelo de efectos mixtos si tiene factores aleatorios. Para Ajustar modelo lineal general, la respuesta es continua.

La variable de respuesta debe ser binaria
Una respuesta binaria tiene dos resultados, como por ejemplo pasa o no pasa.
  • Si la variable de respuesta contiene tres o más categorías que tienen un orden natural, como por ejemplo completamente en desacuerdo, en desacuerdo, neutral, de acuerdo, completamente de acuerdo, utilice Regresión logística ordinal.
  • Si la variable de respuesta contiene tres o más categorías que no tienen un orden natural, como por ejemplo raya, hendidura y rotura, utilice Regresión logística nominal.
  • Si la variable de respuesta cuenta ocurrencias, tales como el número de defectos, utilice Ajustar modelo de Poisson.
Considere el uso de una técnica de validación de modelos
Minitab permite elegir validar el modelo con un conjunto de datos de prueba o con validación cruzada. Las estadísticas de resumen del modelo, como R2 de la desviación, que son para los datos del proceso de ajuste del modelo tienden a ser optimistas. El uso de un conjunto de datos de prueba o una validación cruzada puede proporcionar una representación más precisa del rendimiento del modelo para los nuevos datos.
Recolecte los datos utilizando las mejores prácticas
Para asegurar que los resultados sean válidos, considere las siguientes pautas:
  • Asegúrese de que los datos representen a la población de interés.
  • Recolecte suficiente datos para proporcionar la precisión necesaria.
  • Mida las variables con tanta exactitud y precisión como sea posible.
  • Registre los datos en el orden de recolección.
La correlación entre los predictores, también conocida como multicolinealidad, no debe ser severa

Si la multicolinealidad es severa, es probable que usted no pueda determinar cuáles predictores incluir en el modelo. Para determinar la severidad de la multicolinealidad, utilice los factores de inflación de la varianza (FIV) indicados en la tabla Coeficientes de la salida.

El modelo debe proveer un ajuste adecuado a los datos

Si el modelo no se ajusta a los datos, los resultados pueden ser engañosos. En la salida, utilice las gráficas de residuos, los estadísticos de diagnóstico para observaciones poco comunes y los estadísticos de resumen del modelo para determinar qué tan bien se ajusta el modelo a los datos.