Ejemplo de predicción con Clasificación CART®

Un equipo de investigadores recopila y publica información detallada sobre los factores que afectan las enfermedades cardíacas. Las variables incluyen edad, sexo, niveles de colesterol, frecuencia cardíaca máxima, y más. Este ejemplo se basa en un conjunto de datos públicos que proporciona información detallada sobre las enfermedades cardíacas. Los datos originales son de archive.ics.uci.edu.

En el ejemplo de la creación de árboles, los investigadores crearon un árbol de clasificación que identifica predictores importantes para indicar si un paciente tiene enfermedad cardíaca. Los investigadores quieren hacer predicciones con este árbol.

  1. Completo Ejemplo de creación de árboles con Clasificación CART®.
  2. Haga clic en el Predecir en la parte inferior de los resultados del árbol de clasificación.
  3. En la lista desplegable, seleccione Ingresar valores individuales.
  4. Introduzca los siguientes valores. En este ejemplo se utilizan 2 valores para cada predictor. Es importante elegir valores que estén dentro del rango de los datos originales. Este ejemplo utiliza 2 valores para cada predictor, por lo que la tercera columna permanece vacía.
    Edad 35 35  
    Descansar la presión arterial 140 140  
    Colesterol 233 233  
    Frecuencia cardíaca máxima 150 165  
    Old Peak 2.3 2.3  
    Sexo masculino Mujer  
    Azúcar en la sangre en ayunas Verdad Verdad  
    Ejercicio Angina * *  
    Rest ECG 0 1  
    Pendiente 1 3  
    Thal Normal Normal  
    Tipo de dolor torácico 2 1  
    Buques principales 0 2  
  5. Haga clic Aceptar.

Interpretar los resultados

Minitab utiliza el árbol de clasificación en los resultados para estimar la probabilidad de clase para los 2 conjuntos de valores de predicción.
  • Para el primer conjunto de valores de predicción, la configuración es la misma que la configuración del nodo de terminal 1. La predicción de clase es No. La probabilidad de No es 0.91, y la probabilidad de Sí es 0.09.
  • Para el segundo conjunto de valores de predicción, la configuración es la misma que la configuración del nodo de terminal 4. La predicción de clase es Sí. La probabilidad de Sí es de aproximadamente 0,74, y la probabilidad de No es de aproximadamente 0,26.

CART® clasificación de 7 nodos: Enfermedad cardíaca vs. Edad, Descansar la presión arterial, Colesterol, Frecuencia cardíaca máxima, Old Peak, Sexo, Azúcar en la sangre en ayunas, Ejercicio Angina, Rest ECG, Pendiente, Thal, Tipo de dolor torácico, Buques principales

Método Probabilidades anteriores Igual para todas las clases División de nodos Gini Árbol óptimo Costo mínimo de clasificación errónea Validación del modelo Validación cruzada de 10 pliegues Filas utilizadas 303

Predicción del CART® clasificación

Predicción para Enfermedad cardíaca

Configuración

Edad = 35, Descansar la presión arterial = 140, Colesterol = 233, Frecuencia cardíaca máxima = 150, Old Peak = 2.3, Sexo = Masculino, Azúcar en la sangre en ayunas = Verdad, Ejercicio Angina = *, Rest ECG = 0, Pendiente = 1, Thal = Normal, Tipo de dolor torácico = 2, Buques principales = 0

Predicción Prob. Prob. ID de nodo (Clase (Clase Obs terminal Clase = Sí) = No) 1 1 No 0.09 0.91

Predicción para Enfermedad cardíaca

Configuración

Edad = 35, Descansar la presión arterial = 140, Colesterol = 233, Frecuencia cardíaca máxima = 165, Old Peak = 2.3, Sexo = Mujer, Azúcar en la sangre en ayunas = Verdad, Ejercicio Angina = *, Rest ECG = 1, Pendiente = 3, Thal = Normal, Tipo de dolor torácico = 1, Buques principales = 2

Predicción ID de nodo Prob. (Clase Prob. (Clase Obs terminal Clase = Sí) = No) 2 4 Sí 0.740741 0.259259
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política