Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.
Los modelos TreeNet® son un enfoque para resolver problemas de clasificación y regresión que son más precisos y resistentes al sobreajuste que una clasificación individual o un árbol de regresión. La descripción amplia y general del proceso sería que comenzamos con un árbol de regresión pequeño como modelo inicial. De ese árbol provienen los residuos para cada fila de los datos que se convierten en la variable de respuesta para el siguiente árbol de regresión. A continuación, construimos otro árbol de regresión pequeño para predecir los residuos del primer árbol y se calculan los residuos resultantes nuevamente. Repetimos esta secuencia hasta que se identifica un número óptimo de árboles con un mínimo error de predicción utilizando un método de validación. La secuencia resultante de árboles conforma el modelo de regresión TreeNet®.
Para el caso de la regresión, podemos añadir una descripción general del análisis, pero algunos detalles dependen de cuál de los siguientes es la función de pérdida:
Estadística | Valor |
---|---|
Ajuste inicial, | media de la variable de respuesta |
Residuo generalizado, como valor de respuesta para la fila i | |
Dentro de las actualizaciones de nodos, | media de |
Estadística | Valor |
---|---|
Ajuste inicial, | mediana de la variable de respuesta |
Residuo generalizado, como valor de respuesta para la fila i | |
Dentro de las actualizaciones de nodos, | mediana de |
Para la función de pérdida Huber, las estadísticas son las siguientes:
El ajuste inicial, , es igual a la mediana de todos los valores de respuesta.
Para ampliar el árbol jth,
A continuación, el residuo generalizado para iésima fila es el siguiente:
Los residuos generalizados se utilizan como valores de respuesta para ampliar el jésimo árbol.
El valor actualizado para las filas del mésimo nodo terminal del jésimo árbol es el siguiente:
La media de la expresión anterior se calcula en todas las filas al interior del nodo terminal m del jésimo árbol.
En los detalles anteriores, es el valor de la variable de respuesta para la fila i, es el valor ajustado de los árboles j – 1 anteriores, y es un vector que representa la iésima fila de los valores predictores en los datos de entrenamiento.
Entrada | Símbolo |
---|---|
tasa de aprendizaje | |
tasa de muestreo | |
número máximo de nodos terminales por árbol | |
número de árboles | |
valor de cambio |