Gráfica de MAD vs. número de nodos terminales para Regresión CART®

Minitab muestra una gráfica de valores de desviación absoluta media (MAD) respecto al número de nodos terminales del árbol para que pueda seleccionar un árbol para evaluarlo más. Si utiliza un conjunto de datos de prueba o una validación cruzada de K pliegues para validar el rendimiento del árbol, entonces el valor de MAD es para los datos de validación.

La gráfica de MAD vs. número de nodos terminales muestra el valor de MAD para cada árbol. Esta gráfica aparece cuando el método de división de nodos es Desviación absoluta mínima. De forma predeterminada, el árbol de regresión inicial es el árbol más pequeño con un valor de MAD dentro de 1 error estándar del valor mínimo de MAD. Cuando el análisis utiliza la validación cruzada o un conjunto de datos de prueba, el valor de MAD procede del ejemplo de validación. Los valores de la muestra de validación normalmente se nivelan y, finalmente, comienzan a aumentar a medida que el árbol crece.

Haga clic en Seleccionar árbol alternativo para abrir una gráfica interactiva que incluya una tabla de estadísticos de resumen del modelo. Utilice la gráfica para investigar árboles alternativos con un rendimiento similar.

Normalmente, se selecciona un árbol alternativo por una de las dos razones siguientes:
  • El árbol que Minitab selecciona es parte de un patrón donde el criterio mejora. Uno o más árboles que tienen algunos nodos más forman parte del mismo patrón. Normalmente, desea realizar predicciones desde un árbol con la mayor precisión de predicción posible.
  • El árbol que Minitab selecciona es parte de un patrón donde el criterio es relativamente plano. Uno o más árboles con estadísticos de resumen del modelo similares tienen muchos menos nodos que el árbol óptimo. Normalmente, un árbol con menos nodos terminales proporciona una imagen más clara de cómo cada variable predictora afecta a los valores de respuesta. Un árbol más pequeño también facilita la identificación de algunos grupos objetivo para estudios posteriores. Si la diferencia en la exactitud de la predicción de un árbol más pequeño es insignificante, también puede utilizar el árbol más pequeño para evaluar las relaciones entre la respuesta y las variables predictoras

Interpretación

Resultado clave: Gráfica de MAD vs. número de nodos terminales para un árbol con 34 nodos terminales

El árbol de regresión con 34 nodos terminales tiene un valor de MAD de aproximadamente 0.38. Este árbol tiene la etiqueta "Óptimo" porque el criterio para la creación del árbol era el árbol más pequeño con un valor de desviación dentro de 1 error estándar del valor de desviación absoluta menor. Debido a que esta gráfica muestra que los valores de MAD son relativamente estables entre árboles con unos 30 nodos y árboles con unos 80 nodos, los investigadores desean ver el rendimiento de algunos de los árboles aún más pequeños que son similares al árbol en los resultados. Compare la siguiente gráfica para ver los resultados para un árbol con 29 nodos.

Resultado clave: Gráfica de MAD vs. número de nodos terminales para un árbol con 29 nodos terminales

El árbol de regresión con 29 nodos terminales tiene un valor de MAD de 0.3826. El árbol de los resultados iniciales mantiene la etiqueta "Óptimo" cuando se utiliza Seleccionar árbol alternativo para crear resultados para un árbol diferente.