Complete los pasos siguientes para dividir los datos en un conjunto de datos de entrenamiento y un conjunto de datos de prueba.
- En la lista desplegable, seleccione Validación con un conjunto de prueba.
- Elija una de las siguientes opciones para especificar si desea seleccionar una fracción de filas aleatoriamente o con una columna ID.
- Seleccionar aleatoriamente una fracción de filas como
un conjunto de prueba: Seleccione esta opción para que Minitab seleccione aleatoriamente el conjunto de datos de prueba. Puede especificar la cantidad de datos que se utilizarán en el conjunto de datos de prueba. El valor predeterminado de 0.3 funciona bien en la mayoría de los casos. Es conveniente incluir suficientes datos en el conjunto de datos de prueba para evaluar el modelo correctamente. Si no está seguro acerca de la forma del modelo, un conjunto de datos de prueba más grande proporciona una validación más sólida. También es conveniente que haya datos suficientes del conjunto de datos de entrenamiento para estimar el modelo correctamente. Normalmente, los modelos con más predictores requieren más datos de entrenamiento para hacer estimaciones.
- Definir
división para entrenamiento/prueba con la columna ID: Seleccione esta opción para seleccionar las filas que desea incluir usted mismo en el ejemplo de prueba. En Columna
ID, escriba la columna que indica las filas que se utilizarán para la muestra de prueba. La columna ID debe contener solo 2 valores. En Nivel para el
conjunto de prueba, seleccione el nivel que desea utilizar como la muestra de prueba.
- (Opcional) Marque Almacenar
columna ID para división de entrenamiento/prueba para guardar la columna ID.