Ejemplo de predicción con Clasificación CART®

Un equipo de investigadores recopila y publica información detallada sobre los factores que afectan las enfermedades cardíacas. Las variables incluyen edad, sexo, niveles de colesterol, frecuencia cardíaca máxima, y más. Este ejemplo se basa en un conjunto de datos públicos que proporciona información detallada sobre las enfermedades cardíacas. Los datos originales son de archive.ics.uci.edu.

En el ejemplo de la creación de árboles, los investigadores crearon un árbol de clasificación que identifica predictores importantes para indicar si un paciente tiene enfermedad cardíaca. Los investigadores quieren hacer predicciones con este árbol.

  1. Completo Ejemplo de Clasificación CART®.
  2. Haga clic en el Predecir en la parte inferior de los resultados del árbol de clasificación.
  3. En la lista desplegable, seleccione Ingresar valores individuales.
  4. Introduzca los siguientes valores. En este ejemplo se utilizan 2 valores para cada predictor. Es importante elegir valores que estén dentro del rango de los datos originales. Este ejemplo utiliza 2 valores para cada predictor, por lo que la tercera columna permanece vacía.
    Edad 35 35  
    Descansar la presión arterial 140 140  
    Colesterol 233 233  
    Frecuencia cardíaca máxima 150 165  
    Old Peak 2.3 2.3  
    Sexo Masculino Mujer  
    Tipo de dolor torácico 2 1  
    Azúcar en la sangre en ayunas Verdad Verdad  
    Rest ECG 0 1  
    Ejercicio Angina      
    Pendiente 1 3  
    Buques principales 0 2  
    Thal Normal Normal  
  5. Haga clic Aceptar.

Interpretar los resultados

Minitab utiliza el árbol de clasificación en los resultados para estimar la probabilidad de clase para los 2 conjuntos de valores de predicción.
  • Para el primer conjunto de valores de predicción, la configuración es la misma que la configuración del nodo de terminal 1. La predicción de clase es No. La probabilidad de No es 0.91, y la probabilidad de Sí es 0.09.
  • Para el segundo conjunto de valores de predicción, la configuración es la misma que la configuración del nodo de terminal 4. La predicción de clase es Sí. La probabilidad de Sí es de aproximadamente 0,74, y la probabilidad de No es de aproximadamente 0,26.

Clasificación CART® de 7 nodos: Enfermedad cardíaca vs. Edad, Descansar la presión arterial, Colesterol, Frecuencia cardíaca máxima, Old Peak, Sexo, Azúcar en la sangre en ayunas, Ejercicio Angina, Rest ECG, Pendiente, Thal, Tipo de dolor torácico, Buques principales

Método Probabilidades anteriores Igual para todas las clases División de nodos Gini Árbol óptimo Costo mínimo de clasificación errónea Validación del modelo Validación cruzada de 10 pliegues Filas utilizadas 303

Predicción de clasificación CART®

Predicción para Enfermedad cardíaca

Configuración Edad = 35, Descansar la presión arterial = 140, Colesterol = 233, Frecuencia cardíaca máxima = 150, Old Peak = 2.3, Sexo = Masculino, Tipo de dolor torácico = 2, Azúcar en la sangre en ayunas = Verdad, Rest ECG = 0, Ejercicio Angina = "", Pendiente = 1, Buques principales = 0, Thal = Normal
Predicción Prob. Prob. ID de nodo (Clase (Clase Obs terminal Clase = Sí) = No) 1 1 No 0.09 0.91

Predicción para Enfermedad cardíaca

Configuración Edad = 35, Descansar la presión arterial = 140, Colesterol = 233, Frecuencia cardíaca máxima = 165, Old Peak = 2.3, Sexo = Mujer, Tipo de dolor torácico = 1, Azúcar en la sangre en ayunas = Verdad, Rest ECG = 1, Ejercicio Angina = "", Pendiente = 3, Buques principales = 2, Thal = Normal
Predicción ID de nodo Prob. (Clase Prob. (Clase Obs terminal Clase = Sí) = No) 2 4 Sí 0.740741 0.259259