Especificar el método de validación para Regresión CART®

Estadísticas > Analítica predictiva > Regresión CART® > Validación

Elija el método de validación para probar el modelo. Por lo general, con muestras más pequeñas, el método de validación cruzada de K pliegues es apropiado. Con muestras más grandes, puede seleccionar una fracción de los casos que se utilizarán para el entrenamiento y las pruebas.

Validación cruzada de K pliegues

Complete los pasos siguientes si desea utilizar el método de validación cruzada de K pliegues para validar la muestra de prueba. El método de validación cruzada de K pliegues es el método predeterminado cuando el número de filas es ≤ 5000.

  1. En la lista desplegable, seleccione Validación cruzada de K pliegues.
  2. Elija una de las siguientes opciones para especificar si desea asignar pliegues aleatoriamente o con una columna ID:
    • Asignar aleatoriamente filas de cada pliegue: Seleccione esta opción para que Minitab seleccione aleatoriamente filas para cada pliegue. Puede especificar el número de pliegues. El valor predeterminado de 10 funciona bien en la mayoría de los casos. El uso de un valor más bajo de K puede introducir más sesgo; sin embargo, los valores más grandes de K pueden introducir más variabilidad. También puede establecer una base para el generador de números aleatorios.
    • Asignar filas de cada pliegue por columna ID: Seleccione esta opción para elegir las filas que desea incluir en cada pliegue. En Columna ID, escriba la columna que contiene las filas de cada pliegue.
  3. (Opcional) Marque Almacenar la columna ID para la validación cruzada de K pliegues para guardar la columna ID.

Validación con un conjunto de prueba

Complete los pasos siguientes si desea especificar una fracción de los datos que se usarán para el entrenamiento y las pruebas. El método de validación del conjunto de pruebas es el método predeterminado cuando el número de filas es > 5000. En muchos casos, el 70% de los datos se utilizan para el entrenamiento y el 30% de los datos se utilizan para las pruebas.

  1. En la lista desplegable, seleccione Validación con un conjunto de prueba.
  2. Elija una de las siguientes opciones para especificar si desea seleccionar una fracción de filas aleatoriamente o con una columna ID.
    • Seleccionar aleatoriamente una fracción de filas como conjunto de prueba: Seleccione esta opción para que Minitab seleccione aleatoriamente una fracción de filas para las pruebas. Puede especificar la fracción. El valor predeterminado de 0.3 funciona bien en la mayoría de los casos. Para conjuntos de datos más grandes, es posible que desee aumentar la fracción de datos utilizados para las pruebas. También puede establecer una base para el generador de números aleatorios.
    • Definir división para entrenamiento/prueba por columna ID: Seleccione esta opción para elegir las filas que desea incluir en la muestra de prueba. En Columna ID, escriba la columna que indica las filas que se van a utilizar para la muestra de prueba. La columna ID debe contener solo 2 valores. En Nivel para el conjunto de prueba, seleccione el nivel que desea utilizar como muestra de prueba.
  3. (Opcional) Marque Almacenar la columna ID para la división de entrenamiento/prueba para guardar la columna ID.

Ninguno

Si se selecciona Ninguno, no se realiza ninguna validación adicional.
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política