Seleccionar un árbol alternativo para Regresión CART®

Ejecute Módulo de análisis predictivo > Regresión CART®. Marca Seleccionar árbol alternativo en los resultados.

Revisión general

Por opción predeterminada, Minitab Statistical Software produce resultados para el árbol más pequeño con un valor de criterio dentro de un error estándar del mejor valor. El criterio es el mínimo cuadrado de error o la desviación absoluta mínima, dependiendo de su elección. Minitab le permite explorar otros árboles de la secuencia que condujo a la identificación del árbol óptimo. Normalmente, se selecciona un árbol alternativo por una de las dos razones siguientes:
  • El árbol que Minitab selecciona es parte de un patrón donde el criterio mejora. Uno o más árboles que tienen algunos nodos más forman parte del mismo patrón. Normalmente, lo que se desea es realizar predicciones a partir de un árbol con la mayor exactitud de predicción posible.
  • El árbol que Minitab selecciona es parte de un patrón donde el criterio es relativamente plano. Uno o más árboles con estadísticas de resumen del modelo similares tienen muchos menos nodos que el árbol óptimo. Normalmente, un árbol con menos nodos terminales proporciona una imagen más clara de cómo cada variable predictora afecta a los valores de respuesta. Un árbol más pequeño también facilita la identificación de algunos grupos objetivo para estudios posteriores. Si la diferencia en la exactitud de predicción para un árbol más pequeño es insignificante, también puede utilizar el árbol más pequeño para evaluar las relaciones entre la respuesta y las variables predictoras
Por ejemplo, la siguiente gráfica acompaña los resultados sobre el árbol con 21 nodos. Otros árboles de la secuencia tienen valores similares de R2.
El árbol de 17 nodos tiene un valor de R2 que es casi tan alto como el árbol de 21 nodos. Normalmente, un árbol con menos nodos terminales proporciona una imagen más clara de cómo cada variable predictora afecta a los valores de respuesta. Un árbol más pequeño también facilita la identificación de algunos grupos objetivo para estudios posteriores. Si la reducción de la exactitud de predicción de un árbol mucho más pequeño es insignificante, puede utilizar el árbol mucho más pequeño para evaluar las relaciones entre la respuesta y las variables predictoras.
Además de los valores de criterio para árboles alternativos, también puede comparar la complejidad de los árboles y la utilidad de diferentes nodos. Considere los siguientes ejemplos de razones por las que un analista elige un árbol determinado que no sacrifica el rendimiento en comparación con otros árboles:
  • El analista elige un árbol más pequeño que proporciona una vista más clara de las variables más importantes.
  • El análisis elige un árbol porque las divisiones están en variables que son más fáciles de medir que las variables de otro árbol.
  • El analista elige un árbol porque un nodo terminal determinado es de interés.

Realizar el análisis

Haga clic en Seleccionar árbol alternativo en la salida. Se abre un cuadro de diálogo que muestra la gráfica del criterio en función del número de nodos terminales, un diagrama de árbol y una tabla que resume el árbol o el nodo seleccionado.

Comparar criterios

El cuadro de diálogo proporciona tres formas de seleccionar árboles alternativos:
  • Haga clic en un punto de la gráfica.
  • Haga clic en los botones de flecha en la parte inferior derecha de la gráfica para seleccionar un árbol que sea un árbol más grande o más pequeño que la selección actual.
  • Haga clic en un botón para seleccionar un árbol que sea una opción común. Las opciones dependen de si el criterio para el árbol óptimo es el mínimo cuadrado del error o la desviación absoluta mínima. Cuando el análisis no utiliza la validación, no se aplican los botones que hacen referencia al error estándar.
    Mínimo cuadrado del error
    R-cuadrado máx.
    Seleccione el árbol con el valor de R2 más grande en la gráfica.
    Dentro 1 error estándar de R-cuad. Máx
    Seleccione el árbol más pequeño que tenga un valor de R2 dentro de un error estándar del valor de R2 más grande.
    Dentro 2 errores estándar de R-cuad. Máx
    Seleccione el árbol más pequeño que tenga un valor de R2 dentro de 2 errores estándar del valor de R2 más grande.
    Desviación absoluta mínima
    MAD mín.
    Seleccione el árbol con el valor de desviación media absoluta (MAD) más pequeño en la gráfica.
    Dentro 1 error estándar de MAD
    Seleccione el árbol más pequeño que tenga un valor de MAD dentro de un error estándar del valor de MAD más pequeño.
    Dentro 2 errores estándar de MAD
    Seleccione el árbol más pequeño que tenga un valor de MAD dentro de 2 errores estándar del valor de MAD más pequeño.

Investigar el árbol y los nodos

El árbol proporciona las siguientes interacciones en la barra de herramientas:
  • Resaltar los 5 nodos con la menor variación del valor ajustado para el nodo. Estos nodos son los nodos óptimos.
  • Resaltar los 5 nodos con las medias o medianas más altas, dependiendo del criterio del árbol.
  • Resaltar los 5 nodos con las medias o medianas más bajas, dependiendo del criterio del árbol.
  • Cambiar entre Árbol detallado y Árbol con división de nodos. La Árbol con división de nodos es útil cuando tiene un árbol grande y desea ver solo qué variables dividen los nodos.
  • Ampliar y reducir el árbol.

Puede seleccionar nodos individuales en el árbol para ver detalles sobre el nodo en la tabla. Los detalles incluyen la media si el criterio es el R2 máximo y la mediana si el criterio es la desviación absoluta mínima. Los detalles también incluyen la desviación estándar del nodo y las reglas para llegar al nodo. Haga clic en Copiar reglas en el portapapeles para que pueda pegar las reglas en otro lugar.

Para volver a seleccionar todo el árbol, haga clic en cualquier parte del diagrama que no sea un nodo individual.

Crear un nuevo árbol

Haga clic en Crear árbol para crear y almacenar los resultados de un árbol alternativo que elija. Las selecciones para los resultados y el almacenamiento son las mismas que para el árbol original. Las gráficas y tablas para el árbol alternativo se encuentran en una nueva ficha de salida. Las columnas almacenadas están en la hoja de trabajo con los datos originales.