Gráfica de residuos por nodo terminal para Regresión CART®

Los residuos proporcionan un resumen gráfico del error en cada nodo. La gráfica simplifica las comparaciones de la exactitud de los nodos.

Interpretación

Los residuos resumen el error en un nodo y pueden ayudar a identificar casos con un ajuste deficiente. Puede tener la mayor confianza en los ajustes de nodos con pequeños residuos en relación con la escala de la variable de respuesta. Los nodos con una dispersión más amplia de residuos pueden representar oportunidades para reducir o explicar más variación. Puede elegir si desea investigar casos que muestren patrones inusuales.

De forma predeterminada, los nodos están en orden desde el menor error hasta el mayor error. Al ejecutar el análisis, puede encontrar una opción para ordenar los nodos por número de identificación presionando el botón Gráficas.

Cuando el análisis utiliza un conjunto de datos de prueba, la gráfica incluye representaciones independientes para los datos de entrenamiento y de prueba. El rendimiento del árbol en los datos de prueba suele ser una mejor representación del rendimiento del árbol para nuevos datos. Debe investigar diferencias grandes entre los datos de prueba y de entrenamiento.

En la siguiente gráfica, el nodo terminal 1 contiene el residuo más grande. El nodo terminal 13 tiene un rastro de residuos negativos. Más investigación de estos puntos podría revelar la razón por la que el árbol no ajusta estos puntos, así como otros puntos en el nodo. El nodo terminal 17 tiene el MSE más pequeño de los nodos terminales. El rango de los residuos en el nodo terminal 17 es relativamente pequeño en comparación con los nodos del otro lado de la gráfica.