Diagrama de árbol para Regresión CART®

Por opción predeterminada, Minitab muestra el árbol más pequeño con un valor de R2 que está dentro de un error estándar del valor de R2 máximo.

Haga clic con el botón derecho en el diagrama de árbol para realizar las siguientes interacciones:
  • Resalte los 5 nodos con la menor variación del valor ajustado para el nodo. Estos nodos son los nodos óptimos.
  • Resalte los 5 nodos con las medias o medianas más altas, dependiendo del criterio del árbol.
  • Resalte los 5 nodos con las medias o medianas más bajas, dependiendo del criterio del árbol.
  • Copie los valores de los predictores que conducen a un nodo que seleccione. Estos valores son las reglas del nodo.
  • Muestre la vista de división de nodo. Esta vista es útil cuando tiene un árbol grande y desea ver solo qué variables dividen los nodos.

El nodo raíz es el nodo superior del árbol y es el único nodo que no tiene padres. En cada nodo, los datos se dividen en 2 hijos, dependiendo de las características de los datos. Los nodos continúan dividiéndose hasta que el árbol se queda sin datos por dividir. En otras palabras, los nodos terminales no se pueden dividir en agrupaciones adicionales.

Cuando se valida el rendimiento del árbol con un conjunto de datos de prueba, el diagrama de árbol muestra los casos del conjunto de datos de entrenamiento.

Interpretación

Cada nodo contiene detalles sobre la media, la desviación estándar y el conteo.

ID de nodo
Proporciona la designación de nodo o nodo terminal. El nodo terminal es un nodo final que no se puede dividir más.
Media
La media es el valor de la respuesta media de los casos en el nodo. La media es el valor pronosticado para nuevos datos que se ubican en el mismo nodo. Los nodos terminales con las medias más diferentes respecto a los otros nodos terminales pueden ser de especial interés porque las predicciones para los casos en esos nodos terminales son las más diferentes. Por ejemplo, las medias más grandes o más pequeñas pueden ser de especial interés.
Desviación estándar
La desviación estándar es la desviación estándar de los valores de respuesta en el nodo. Los nodos terminales con desviaciones estándar más pequeñas pueden ser de especial interés porque las predicciones de estos nodos son más precisas que las de nodos terminales con desviaciones estándar más grandes.
Conteo total
El conteo total es el número de casos en el nodo. Si el análisis incluye ponderaciones, el conteo es el conteo total ponderado. Los nodos terminales con muchos casos pueden ser de especial interés porque estos nodos suelen representar casos más comunes.