Especificar el método de validación para MARS®

Módulo de análisis predictivo > Regresión MARS® > Validación
Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

Elija el método de validación para probar el modelo. Por lo general, con muestras más pequeñas, el método de validación cruzada de K pliegues es apropiado. Con muestras más grandes, puede seleccionar una fracción de los casos que se utilizarán para el entrenamiento y las pruebas.

Validación cruzada de K pliegues

Complete los pasos siguientes si desea utilizar el método de validación cruzada de K pliegues para validar la muestra de prueba. El método de validación cruzada de K pliegues es el método predeterminado cuando el número de filas es ≤ 2000.

  1. En la lista desplegable, seleccione Validación cruzada de K pliegues.
  2. Elija una de las siguientes opciones para especificar si desea asignar pliegues aleatoriamente o con una columna ID:
    • Asignar aleatoriamente filas de cada pliegue: Seleccione esta opción para que Minitab seleccione aleatoriamente filas para cada pliegue. Puede especificar el número de pliegues. El valor predeterminado de 5 funciona bien en la mayoría de los casos. Un mayor número de pliegues aumenta la posibilidad de seleccionar un modelo predictivo más confiable, especialmente para conjuntos de datos con menos filas, pero puede aumentar significativamente el tiempo de cálculo.
    • Asignar filas de cada pliegue con la columna de ID: Seleccione esta opción para elegir las filas que desea incluir en cada pliegue. En Columna ID, ingrese la columna que contiene las filas para cada pliegue.
  3. (Opcional) Seleccione Almacenar columna ID para validación cruzada de K pliegues para guardar la columna ID.

Validación con un conjunto de prueba

Complete los pasos siguientes para especificar una fracción de los datos que se usarán para el entrenamiento y las pruebas. El método de validación del conjunto de pruebas es el método predeterminado cuando el número de filas es > 2000. En muchos casos, el 70% de los datos se utilizan para el entrenamiento y el 30% de los datos se utilizan para las pruebas.

  1. En la lista desplegable, seleccione Validación con un conjunto de prueba.
  2. Elija una de las siguientes opciones para especificar si desea seleccionar una fracción de filas aleatoriamente o con una columna ID.
    • Seleccionar aleatoriamente una fracción de filas como un conjunto de prueba: Seleccione esta opción para que Minitab seleccione aleatoriamente una fracción de filas para las pruebas. Puede especificar la fracción. El valor predeterminado de 0.3 funciona bien en la mayoría de los casos. Para conjuntos de datos más grandes, es posible que desee aumentar la fracción de datos utilizados para las pruebas. También puede establecer una base para el generador de números aleatorios.
    • Definir división para entrenamiento/prueba con la columna ID: Seleccione esta opción para elegir las filas que se incluirán en la muestra de prueba. En Columna ID, ingrese la columna que indica las filas que se utilizarán para la muestra de prueba. La columna ID debe contener solo 2 valores. En Nivel para el conjunto de prueba, seleccione el nivel que utilizará como la muestra de prueba.
  3. (Opcional) Seleccione Almacenar columna ID para división de entrenamiento/prueba para guardar la columna ID.

Ninguno

Si se selecciona Ninguno, no se realiza ninguna validación adicional.