Especificar el método de validación para Ajustar modelo y Descubrir predictores clave con Clasificación TreeNet®

Módulo de análisis predictivo > Clasificación TreeNet® > Ajustar modelo > Validación

Módulo de análisis predictivo > Clasificación TreeNet® > Descubrir predictores clave > Validación

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Elija el método de validación para probar el modelo. Por lo general, con muestras más pequeñas, el método de validación cruzada con k-fold es apropiado. Con muestras más grandes, puede seleccionar una fracción de los casos que se utilizarán para el entrenamiento y las pruebas.

Validación cruzada de K pliegues

Complete los pasos siguientes para usar el método de validación cruzada con k-fold para validar la muestra de prueba. El método de validación cruzada con k-fold es el método predeterminado cuando el número de filas es ≤ 2000.

  1. En la lista desplegable, seleccione Validación cruzada de K pliegues.
  2. Elija una de las siguientes opciones para especificar si desea asignar grupos aleatoriamente o con una columna ID.
    • Asignar aleatoriamente filas de cada pliegue: Seleccione esta opción para que Minitab seleccione aleatoriamente filas para cada grupo. Para Ajustar modelo, el valor predeterminado de 5 funciona bien en la mayoría de los casos. Para Descubrir predictores clave, el valor predeterminado de 3 hace que los cálculos sean relativamente más rápidos. Un mayor número de grupos en cualquier caso puede ayudar a identificar un mejor modelo predictivo, pero puede aumentar significativamente el tiempo de cálculo.
    • Asignar filas de cada pliegue con la columna de ID: Seleccione esta opción para elegir las filas que desea incluir en cada grupo. En Columna ID, ingrese la columna que contiene las filas para cada grupo.
  3. (Opcional) Marque Almacenar columna ID para validación cruzada de K pliegues para guardar la columna ID.

Validación con un conjunto de prueba

Complete los pasos siguientes para especificar una fracción de los datos que se usarán para el entrenamiento y las pruebas. El método de validación del conjunto de pruebas es el método predeterminado cuando el número de filas es > 2000. En muchos casos, el 70% de los datos se utilizan para el entrenamiento y el 30% de los datos se utilizan para las pruebas.

  1. En la lista desplegable, seleccione Validación con un conjunto de prueba.
  2. Elija una de las siguientes opciones para especificar si desea seleccionar una fracción de filas aleatoriamente o con una columna ID.
    • Seleccionar aleatoriamente una fracción de filas como un conjunto de prueba: Seleccione esta opción para que Minitab seleccione aleatoriamente una fracción de filas para las pruebas. Puede especificar la fracción. El valor predeterminado de 0.3 funciona bien en la mayoría de los casos. Para conjuntos de datos más grandes, es posible que desee aumentar la fracción de datos utilizados para las pruebas. También puede establecer una base para el generador de números aleatorios.
    • Definir división para entrenamiento/prueba con la columna ID: Seleccione esta opción para elegir las filas que se incluirán en la muestra de prueba. En Columna ID, ingrese la columna que indica las filas que se utilizarán para la muestra de prueba. La columna ID debe contener solo 2 valores. En Nivel para el conjunto de prueba, seleccione el nivel qué utilizará como la muestra de prueba.
  3. (Opcional) Marque Almacenar columna ID para división de entrenamiento/prueba para guardar la columna ID.

Ninguno

Si se selecciona Ninguno, no se realiza ninguna validación adicional.