Especificar el método de validación para Clasificación CART®

Módulo de análisis predictivo > Clasificación CART® > Validación

Elija el método de validación para probar el modelo. Por lo general, con muestras más pequeñas, el método de validación cruzada de K pliegues es apropiado. Con muestras más grandes, puede seleccionar una fracción de los casos que se utilizarán para el entrenamiento y las pruebas.

Validación cruzada de K pliegues

Complete los pasos siguientes para usar el método de validación cruzada de K pliegues para validar la muestra de prueba. El método de validación cruzada de K pliegues es el método predeterminado cuando el número de filas es ≤ 5000.

  1. En la lista desplegable, seleccione Validación cruzada de K pliegues.
  2. Elija una de las siguientes opciones para especificar si desea asignar pliegues aleatoriamente o con una columna ID.
    • Asignar aleatoriamente filas de cada pliegue: Seleccione esta opción para que Minitab seleccione aleatoriamente filas para cada pliegue. Puede especificar el número de pliegues. El valor predeterminado de 10 funciona bien en la mayoría de los casos. El uso de un valor más bajo de K puede introducir más sesgo; sin embargo, los valores más grandes de K pueden introducir más variabilidad. También puede establecer una base para el generador de números aleatorios.
    • Asignar filas de cada pliegue con la columna de ID: Seleccione esta opción para elegir las filas que desea incluir en cada pliegue. En Columna ID, ingrese la columna que contiene las filas para cada pliegue.
  3. (Opcional) Marque Almacenar columna ID para validación cruzada de K pliegues para guardar la columna ID.

Validación con un conjunto de prueba

Complete los pasos siguientes para especificar una fracción de los datos que se usarán para el entrenamiento y las pruebas. El método de validación del conjunto de pruebas es el método predeterminado cuando el número de filas es > 5000. En muchos casos, el 70% de los datos se utilizan para el entrenamiento y el 30% de los datos se utilizan para las pruebas.

  1. En la lista desplegable, seleccione Validación con un conjunto de prueba.
  2. Elija una de las siguientes opciones para especificar si desea seleccionar una fracción de filas aleatoriamente o con una columna ID.
    • Seleccionar aleatoriamente una fracción de filas como un conjunto de prueba: Seleccione esta opción para que Minitab seleccione aleatoriamente una fracción de filas para las pruebas. Puede especificar la fracción. El valor predeterminado de 0.3 funciona bien en la mayoría de los casos. Para conjuntos de datos más grandes, es posible que desee aumentar la fracción de datos utilizados para las pruebas. También puede establecer una base para el generador de números aleatorios.
    • Definir división para entrenamiento/prueba con la columna ID: Seleccione esta opción para elegir las filas que se incluirán en la muestra de prueba. En Columna ID, ingrese la columna que indica las filas que se utilizarán para la muestra de prueba. La columna ID debe contener solo 2 valores. En Nivel para el conjunto de prueba, seleccione el nivel que utilizará como la muestra de prueba.
  3. (Opcional) Marque Almacenar columna ID para división de entrenamiento/prueba para guardar la columna ID.

Ninguno

Si se selecciona Ninguno, no se realiza ninguna validación adicional.