Minitab muestra una gráfica de valores de desviación absoluta media (MAD) respecto al número de nodos terminales del árbol para que pueda seleccionar un árbol para evaluarlo más. Si utiliza un conjunto de datos de prueba o una validación cruzada de K pliegues para validar el rendimiento del árbol, entonces el valor de MAD es para los datos de validación.
La gráfica de MAD vs. número de nodos terminales muestra el valor de MAD para cada árbol. Esta gráfica aparece cuando el método de división de nodos es Desviación absoluta mínima. De forma predeterminada, el árbol de regresión inicial es el árbol más pequeño con un valor de MAD dentro de 1 error estándar del valor mínimo de MAD. Cuando el análisis utiliza la validación cruzada o un conjunto de datos de prueba, el valor de MAD procede del ejemplo de validación. Los valores de la muestra de validación normalmente se nivelan y, finalmente, comienzan a aumentar a medida que el árbol crece.
Haga clic en Seleccionar árbol alternativo para abrir una gráfica interactiva que incluya una tabla de estadísticos de resumen del modelo. Utilice la gráfica para investigar árboles alternativos con un rendimiento similar.
Normalmente, se selecciona un árbol alternativo por una de las dos razones siguientes:
El árbol que Minitab selecciona es parte de un patrón donde el criterio mejora. Uno o más árboles que tienen algunos nodos más forman parte del mismo patrón. Normalmente, desea realizar predicciones desde un árbol con la mayor precisión de predicción posible.
El árbol que Minitab selecciona es parte de un patrón donde el criterio es relativamente plano. Uno o más árboles con estadísticos de resumen del modelo similares tienen muchos menos nodos que el árbol óptimo. Normalmente, un árbol con menos nodos terminales proporciona una imagen más clara de cómo cada variable predictora afecta a los valores de respuesta. Un árbol más pequeño también facilita la identificación de algunos grupos objetivo para estudios posteriores. Si la diferencia en la exactitud de la predicción de un árbol más pequeño es insignificante, también puede utilizar el árbol más pequeño para evaluar las relaciones entre la respuesta y las variables predictoras