Este comando está disponible con el módulo del complemento para análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.
Clasificación Random Forests® utiliza la validación out-of-bag para cada análisis. Si selecciona la validación con un conjunto de prueba además de la validación out-of-bag, la tabla muestra la columna que identifica el conjunto de prueba o el porcentaje de los datos en los conjuntos de prueba y entrenamiento.
El número de muestras de la secuencia de arranque indica el número de árboles en el análisis. Cuando se utiliza la única validación out-of-bag, el tamaño de la muestra es el mismo que el número de filas del análisis. Cuando se usa la validación con un conjunto de prueba, el tamaño predeterminado de la muestra es del mismo tamaño que los datos de entrenamiento. Si elige utilizar un tamaño de muestra menor que el tamaño de los datos de entrenamiento, la tabla muestra ese tamaño.
Esta fila indica si la división de nodos considera cada predictor en cada nodo o un subconjunto aleatorio de los predictores. Si la división de nodos utiliza un subconjunto aleatorio, esta fila indica la selección del número de predictores que se considerarán.
Si usted utiliza todos los predictores inicialmente, considere utilizar un subconjunto de predictores en modelos posteriores para comparar el rendimiento de los modelos.
El tamaño mínimo del nodo interno indica el número mínimo de casos que un nodo puede tener y aún dividirse en más nodos. Si el rendimiento del modelo es inadecuado, considere si desea aumentar este valor para ver el efecto en el rendimiento.
De forma predeterminada, el análisis no tiene una penalización por valor faltante y esta fila no está presente. La penalización por valores faltantes penaliza a una variable predictora por la proporción de valores faltantes. Es menos probable que una variable con una penalización alta se convierta en el divisor de un nodo.
De forma predeterminada, el análisis no tiene una penalización por categoría de alto nivel y esta fila no está presente. La penalización por categoría de alto nivel penaliza a una variable según el número de niveles categóricos en relación con el tamaño del nodo para cada nodo. Por lo tanto, es menos probable que un competidor con muchos niveles en un nodo se convierta en el divisor de ese nodo.
El número de observaciones de respuesta que se encuentran en el análisis.
El número de observaciones de respuesta faltantes.