Consideraciones acerca de los datos para Descubrir el mejor modelo (Respuesta continua)

Nota

Este comando está disponible con el módulo Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

Para asegurarse de que los resultados sean válidos, tenga en cuenta las siguientes directrices al recopilar datos, realizar el análisis e interpretar los resultados.

La variable de respuesta debe ser continua
Una variable continua se puede medir y ordenar, y tiene un número infinito de valores entre dos valores cualesquiera. Por ejemplo, los diámetros de una muestra de llantas son una variable continua.

Los datos de la variable de respuesta deben ser valores numéricos.

Si la variable de respuesta es binaria, utilice Descubrir el mejor modelo (Respuesta binaria).

Las variables predictoras pueden ser continuas o categóricas
Puede utilizar una combinación de predictores continuos o categóricos; sin embargo, las columnas de cada predictor deben tener la misma extensión que la columna de respuesta. Se permiten valores faltantes.
  • Todos los predictores continuos deben ser numéricos.
  • Los predictores categóricos pueden ser valores de texto o numéricos.
Un conjunto de prueba está predeterminado cuando el número de casos es > 2000

Minitab utiliza la validación cruzada para comparar los modelos cuando el número de casos es ≤ 2000. Cuando el número de casos es mayor que 2000, Minitab utiliza un conjunto de prueba. Cuando el conjunto de datos es grande, la validación con un conjunto de pruebas reduce el tiempo para analizar los datos. Para obtener más información sobre la configuración de las técnicas de validación en Descubrir el mejor modelo (Respuesta continua), vaya a Especificar el método de validación para Descubrir el mejor modelo (Respuesta continua).

El modelo debe proveer un ajuste adecuado a los datos

Si el modelo no se ajusta a los datos, los resultados pueden ser engañosos. Todos los tipos de modelos incluyen estadísticas de resumen que describen el rendimiento del modelo. Utilice los resultados de la validación cruzada o del conjunto de prueba para determinar si el modelo pronostica bien la respuesta. Para los resultados de un modelo de regresión, utilice también las gráficas residuales para verificar que se mantengan los supuestos paramétricos.