Seleccionar árbol alternativo Cart® Clasificación

Ejecute Estadísticas > Análisis predictivo  > CART® Clasificación. Haga clic en Seleccionar árbol alternativo el botón del archivo Gráfica de costo de clasificación errónea vs. número de nodos terminales.

Visión general

Por opción predeterminada, Minitab Statistical Software produce producción para el árbol más pequeño con un costo de clasificación incorrecta dentro de 1 error estándar del costo de clasificación incorrecta más pequeño. Minitab le permite explorar otros árboles de la secuencia que condujo a la identificación del árbol óptimo. Normalmente, se selecciona un árbol alternativo por una de las dos razones siguientes:
  • El árbol óptimo forma parte de un patrón en el que los costes de clasificación incorrecta disminuyen. Uno o más árboles que tienen algunos nodos más forman parte del mismo patrón. Normalmente, desea realizar predicciones desde un árbol con la mayor precisión de predicción posible. Si el árbol es lo suficientemente simple, también puede usarlo para comprender cómo afecta cada variable predictora a los valores de respuesta.
  • El árbol óptimo forma parte de un patrón en el que los costes de clasificación errónea son relativamente planos. Uno o más árboles con estadísticas de resumen de modelo similares tienen muchos menos nodos que el árbol óptimo. Normalmente, un árbol con menos nodos terminales proporciona una imagen más clara de cómo cada variable predictora afecta a los valores de respuesta. Un árbol más pequeño también facilita la identificación de algunos grupos objetivo para estudios posteriores. Si la diferencia en la precisión de predicción para un árbol más pequeño es insignificante, también puede utilizar el árbol más pequeño para evaluar las relaciones entre la respuesta y las variables predictoras
Por ejemplo, en el siguiente gráfico, el árbol con 4 nodos es el árbol óptimo. Los dos árboles más grandes siguientes forman parte de un patrón en el que el costo de clasificación incorrecta disminuye.
El árbol de 7 nodos tiene un coste de clasificación incorrecta menor que el coste para el árbol de 4 nodos. Dado que el árbol de 7 nodos es similar en complejidad, puede utilizar el árbol más grande con su precisión de predicción adicional para estudiar las variables importantes y realizar predicciones.

Realizar el análisis

Haga clic Seleccionar árbol alternativo en la salida. Se abre un cuadro de diálogo que muestra el trazado y una tabla de resumen del modelo. El cuadro de diálogo proporciona tres formas de seleccionar árboles alternativos:
  • Haga clic en un punto del gráfico.
  • Haga clic en los botones de flecha debajo de la tabla de resumen del modelo para seleccionar un árbol que sea un árbol más grande o menor que la selección actual.
  • Haga clic en un botón para seleccionar un árbol que sea una opción común. Cuando el análisis no utiliza la validación, no se aplican los botones que hacen referencia al error estándar.
    Costo mín.
    Seleccione el árbol con el coste mínimo de clasificación errónea
    Dentro 1 EE de Cost Mín
    Seleccione el árbol más pequeño que tenga un coste de clasificación incorrecta dentro de un error estándar del coste mínimo.
    Dentro 2 EE de Cost Mín
    Seleccione el árbol más pequeño que tenga un coste de clasificación incorrecta dentro de 2 errores estándar del coste mínimo.
    Mejor ROC
    Seleccione el árbol con el área más grande bajo la curva ROC.

Haga clic Crear árbol para crear y almacenar resultados para un árbol alternativo que elija. Las selecciones para los resultados y el almacenamiento son las mismas que para el árbol original. Los gráficos y tablas para el árbol alternativo se encuentran en una nueva pestaña de salida. Las columnas almacenadas están en la hoja de cálculo con los datos originales.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política