Seleccionar las opciones para Clasificación Random Forests®

Módulo de análisis predictivo > Clasificación Random Forests® > Opciones
Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Número de muestras de bootstrap para cultivar árboles
Ingrese un valor para determinar el número de muestras de bootstrap y el número de árboles producidos por el análisis. Ingrese un valor entre 3 y 3000.
Especifique un tamaño de muestra de bootstrap menor que el tamaño de los datos de entrenamiento
Seleccione esta opción para especificar un valor que establezca el tamaño de la muestra de la secuencia de arranque. Debe ingresar un valor mayor que o igual a 5. Si ingresa un tamaño que es mayor que el tamaño de los datos de entrenamiento, Minitab utiliza un tamaño de muestra igual al tamaño de los datos de entrenamiento.
Número de predictores para la división de nodo
Especifique el número de predictores a tener en cuenta para cada división de nodos. Normalmente, el análisis funciona bien si se tiene en cuenta la raíz cuadrada del número total de predictores. Sin embargo, algunos conjuntos de datos tienen asociaciones entre los predictores que conducen a un mejor rendimiento del modelo cuando el análisis considera un número mayor o menor de predictores para cada nodo. Después de usar la raíz cuadrada y ver el modelo, considere si desea cambiar el número de predictores para intentar mejorar el rendimiento del modelo.
  • Raíz cuadrada del número total de predictores: Seleccione esta opción para utilizar la raíz cuadrada del número total de predictores para dividir nodos.
  • Número total de predictores, produciendo un bosque de bootstrap: Seleccione esta opción para utilizar todos los predictores para dividir nodos. El bosque creado por esta opción se denomina bosque de secuencia de arranque.
  • K por ciento del número total de predictores; K =: Seleccione esta opción para utilizar un porcentaje de predictores para dividir nodos.
Base para el generador de números aleatorios
Puede especificar una base para el generador de números aleatorios para seleccionar aleatoriamente las submuestras y el subconjunto de predictores. Normalmente, no es necesario cambiar la base. Puede cambiar la base para explorar la sensibilidad de los resultados a las selecciones aleatorias o para garantizar la misma selección aleatoria para análisis repetidos.
Número mínimo de casos para dividir un nodo interno
Ingrese el número mínimo de casos que un nodo puede tener y aún dividirse en más nodos. Cuando el tamaño de la muestra es de 2,000 o menos, el valor predeterminado es 2 de tal manera que todos los nodos se puedan dividir en nodos más pequeños hasta que otra división sea imposible. Para tamaños más grandes de la muestra, el valor predeterminado es 5. Si el rendimiento del modelo es inadecuado, considere si desea cambiar este valor para ver el efecto en el rendimiento.