Especifique el método de validación para Ajustar modelo logístico binarioy Regresión logística binaria

Estadísticas > Regresión > Regresión logística binaria > Ajustar modelo logístico binario > Validación

Módulo de análisis predictivo > Regresión logística binaria > Validación

Elija el método de validación para probar el modelo. Por lo general, con muestras más pequeñas, el método de validación cruzada de K pliegues es apropiado. Con muestras más grandes, puede seleccionar una fracción de los casos que se utilizarán para el entrenamiento y para las pruebas.

Ninguno

El análisis no valida el modelo.

Validación cruzada de K pliegues

Complete los pasos siguientes para utilizar la validación cruzada de K pliegues.
  1. En la lista desplegable, seleccione Validación cruzada de K pliegues.
  2. Elija una de las siguientes opciones para especificar si desea asignar pliegues aleatoriamente o con una columna ID.
    • Asignar aleatoriamente filas de cada pliegue: Seleccione esta opción para que Minitab seleccione aleatoriamente filas para cada pliegue. Puede especificar el número de pliegues. El valor predeterminado de 10 funciona bien en la mayoría de los casos. El uso de un valor más bajo de K puede introducir más sesgo; sin embargo, los valores más grandes de K pueden introducir más variabilidad. También puede establecer una base para el generador de números aleatorios.
    • Asignar filas de cada pliegue con la columna de ID: Seleccione esta opción para elegir las filas que desea incluir en cada pliegue. En Columna ID, ingrese la columna que identifica los pliegues. Cada fila con el mismo valor en la columna ID está en el mismo pliegue.
    • (Opcional) Seleccione Almacenar columna ID para validación cruzada de K pliegues para guardar la columna ID.

Validación con un conjunto de prueba

Complete los pasos siguientes para dividir los datos en un conjunto de datos de entrenamiento y un conjunto de datos de prueba.
  1. En la lista desplegable, seleccione Validación con un conjunto de prueba.
  2. Elija una de las siguientes opciones para especificar si desea seleccionar una fracción de filas aleatoriamente o con una columna ID.
    • Seleccionar aleatoriamente una fracción de filas como un conjunto de prueba: Seleccione esta opción para que Minitab seleccione aleatoriamente el conjunto de datos de prueba. Puede especificar la cantidad de datos que se utilizarán en el conjunto de datos de prueba. El valor predeterminado de 0.3 funciona bien en la mayoría de los casos. Es conveniente incluir suficientes datos en el conjunto de datos de prueba para evaluar el modelo correctamente. Si no está seguro acerca de la forma del modelo, un conjunto de datos de prueba más grande proporciona una validación más sólida. También es conveniente que haya datos suficientes del conjunto de datos de entrenamiento para estimar el modelo correctamente. Normalmente, los modelos con más predictores requieren más datos de entrenamiento para hacer estimaciones.
    • Definir división para entrenamiento/prueba con la columna ID: Seleccione esta opción para seleccionar las filas que desea incluir usted mismo en el ejemplo de prueba. En Columna ID, ingrese la columna que indica las filas que se utilizarán para la muestra de prueba. La columna ID debe contener solo 2 valores. En Nivel para el conjunto de prueba, seleccione el nivel que utilizará como la muestra de prueba.
  3. (Opcional) Marque Almacenar columna ID para división de entrenamiento/prueba para guardar la columna ID.