Consideraciones acerca de los datos para Regresión CART®

Para asegurarse de que los resultados sean válidos, tenga en cuenta las siguientes directrices al recopilar datos, realizar el análisis e interpretar los resultados.

La variable de respuesta (objetivo) debe ser continua
Una variable continua se puede medir y ordenar, y tiene un número infinito de valores entre dos valores cualquiera. Por ejemplo, los diámetros de una muestra de neumáticos son una variable continua.

Los datos de la variable de respuesta deben ser valores numéricos.

Si la variable de respuesta es categórica, utilice Clasificación CART®.

Las variables predictoras pueden ser continuas o categóricas
Puede utilizar una combinación de predictores continuos o categóricos; sin embargo, las columnas de cada predictor deben tener la misma extensión que la columna de respuesta. Se permiten valores faltantes.
  • Todos los predictores continuos deben ser numéricos.
  • Los predictores categóricos pueden ser valores de texto o numéricos.
Se recomienda un conjunto de prueba cuando el número de casos es > 5000

Por opción predeterminada, Minitab utiliza la validación cruzada cuando el número de casos es ≤ 5000. Cuando el número de casos es mayor que 5000, Minitab utiliza un conjunto de prueba. La validación con un conjunto de datos de entrenamiento y un conjunto de datos de prueba es útil cuando el conjunto de datos es grande. Para obtener más información sobre la configuración de las técnicas de validación en Regresión CART®, vaya a Especificar el método de validación para Regresión CART®.