Consideraciones de datos para Clasificación CART®

Para asegurarse de que los resultados son válidos, tenga en cuenta las siguientes directrices al recopilar datos, realizar el análisis e interpretar los resultados.

La variable de respuesta (objetivo) debe ser categórica
Las variables categóricas contienen un número finito y contable de categorías o grupos distintos. Los datos categóricos pueden o no tener un orden lógico. Por ejemplo, las variables categóricas incluyen el sexo, el tipo de material y el método de pago.
  • Si la variable de respuesta tiene dos categorías, como pass y fail, la respuesta es binaria.
  • Si la variable de respuesta contiene tres o más categorías, la respuesta es multinomial.

Los datos de la variable de respuesta deben ser valores de texto o valores numéricos. No se permiten valores faltantes.

Si la variable de respuesta es continua, utilice Regresión CART®.

Las variables predictoras pueden ser continuas o categóricas
Puede utilizar una combinación de predictores continuos o categóricos; sin embargo, las longitudes de columna para cada predictor deben tener la misma longitud que la columna de respuesta. No se permiten valores faltantes.
  • Todos los predictores continuos deben ser numéricos.
  • Los predictores categóricos pueden ser valores de texto o numéricos.
Se recomienda un conjunto de pruebas cuando el número de casos > 5000

Por opción predeterminada, Minitab utiliza la validación cruzada cuando el número de casos es de 5000 euros. Cuando el número de casos es mayor que 5000, Minitab utiliza un conjunto de pruebas. La validación con un conjunto de datos de entrenamiento y un conjunto de pruebas de datos es útil cuando el conjunto de datos es grande. Para obtener más información sobre la configuración de las técnicas de validación en Clasificación CART®Ir a Especificar el método de validación para Clasificación CART®.