Consideraciones acerca de los datos para Descubrir el mejor modelo (Respuesta binaria)

Nota

Este comando está disponible con el módulo Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

Para asegurarse de que los resultados sean válidos, tenga en cuenta las siguientes directrices al recopilar datos, realizar el análisis e interpretar los resultados.

La variable de respuesta debe ser binaria
Una respuesta binaria tiene dos resultados, como por ejemplo pasa o no pasa. Si la variable de respuesta es continua, utilice Descubrir el mejor modelo (Respuesta continua)
Los predictores pueden ser continuos o categóricos

Una variable continua se puede medir y ordenar, y tiene un número infinito de valores entre dos valores cualesquiera. Por ejemplo, los diámetros de una muestra de llantas son una variable continua.

Las variables categóricas contienen un número finito y contable de categorías o grupos distintos. Los datos categóricos pueden no tener un orden lógico. Por ejemplo, los predictores categóricos incluyen sexo, tipo de material y método de pago.

Si usted tiene una variable discreta, puede decidir si la tratará como un predictor continuo o categórico. Una variable discreta puede medirse y ordenarse, pero tiene un número contable de valores. Por ejemplo, el número de personas que viven en un hogar es una variable discreta. La decisión de tratar una variable discreta como continua o categórica depende del número de niveles, así como del propósito del análisis. Para obtener más información, vaya a ¿Qué son variables categóricas, discretas y continuas?.

Un conjunto de prueba está predeterminado cuando el número de casos es > 2000

Minitab utiliza la validación cruzada para comparar los modelos cuando el número de casos es ≤ 2000. Cuando el número de casos es mayor que 2000, Minitab utiliza un conjunto de prueba. Cuando el conjunto de datos es grande, la validación con un conjunto de pruebas reduce el tiempo para analizar los datos. Para obtener más información sobre la configuración de las técnicas de validación en Descubrir el mejor modelo (Respuesta binaria), vaya a Especificar el método de validación para Descubrir el mejor modelo (Respuesta binaria).

El modelo debe proveer un ajuste adecuado a los datos

Si el modelo no se ajusta a los datos, los resultados pueden ser engañosos. Todos los tipos de modelo incluyen estadísticas de resumen del modelo que describen el rendimiento del modelo. Utilice los resultados de la validación cruzada o del conjunto de prueba para determinar si el modelo pronostica bien la respuesta.