Validación del modelo

Regresión Random Forests® utiliza validación fuera de bolsa para cada análisis. Si selecciona la validación con un conjunto de pruebas además de la validación fuera de la bolsa, la tabla muestra la columna que identifica el conjunto de pruebas o el porcentaje de los datos de los conjuntos de prueba y entrenamiento.

Número de muestras con reemplazamiento (bootstrap)

El número de muestras con reemplazamiento (bootstrap) indica el número de árboles en el análisis. Cuando se utiliza la única validación fuera de bolsa, el tamaño de la muestra es el mismo que el número de filas del análisis. Cuando se utiliza la validación con un conjunto de pruebas, el tamaño de muestra predeterminado es el mismo que el tamaño de los datos de entrenamiento. Si elige usar un tamaño de muestra menor que el tamaño de los datos de entrenamiento, la tabla muestra ese tamaño.

Número de predictores seleccionados para la división de nodos

Esta fila indica si la división de nodos considera cada predictor en cada nodo o un subconjunto aleatorio de los predictores. Si la división de nodos utiliza un subconjunto aleatorio, esta fila indica la selección del número de predictores que se considerarán.

Si usted utiliza todos los predictores inicialmente, considere utilizar un subconjunto de predictores en modelos posteriores para comparar el rendimiento de los modelos.

Tamaño mínimo del nodo interno

El tamaño mínimo del nodo interno indica el número mínimo de casos que un nodo puede tener y aún dividirse en más nodos. Si el rendimiento del modelo es inadecuado, considere si desea aumentar este valor para ver el efecto en el rendimiento.

Penalización por valor faltante

De forma predeterminada, el análisis no tiene una penalización de valor faltante y esta fila no está presente. La penalización por valores faltantes penaliza a una variable predictora por la proporción de valores faltantes. Es menos probable que una variable con una penalización alta se convierta en el divisor de un nodo.

Penalización por categoría de nivel alto

De forma predeterminada, el análisis no tiene una penalización de categoría de alto nivel y esta fila no está presente. La penalización por categoría de nivel alto penaliza a una variable según el número de niveles categóricos en relación con el tamaño del nodo para cada nodo. Por lo tanto, es menos probable que un competidor con muchos niveles en un nodo se convierta en el divisor de ese nodo.

Filas utilizadas

El número de observaciones de respuesta que están en el análisis y que se ajustan al modelo y lo evalúan.

Filas no utilizadas

El número de observaciones de respuesta faltantes.