Matriz de confusión para Clasificación CART®

Encuentre definiciones e interpretaciones para cada estadístico en la matriz de confusión.
La matriz de confusión muestra qué tan bien el árbol separa correctamente las clases utilizando estas métricas:
  • Tasa de verdaderos positivos (TPR): la probabilidad de que un caso evento se prediga correctamente
  • Tasa de falsos positivos (FPR): la probabilidad de que un caso no evento se prediga incorrectamente
  • Tasa de falsos negativos (FNR): la probabilidad de que un caso evento se prediga incorrectamente
  • Tasa de verdaderos negativos (TNR): la probabilidad de que un caso no evento se prediga correctamente

Interpretación

CART® clasificación de 7 nodos: Enfermedad cardíaca vs. Edad, Descansar la presión arterial, Colesterol, Frecuencia cardíaca máxima, Old Peak, Sexo, Azúcar en la sangre en ayunas, Ejercicio Angina, Rest ECG, Pendiente, Thal, Tipo de dolor torácico, Buques principales

Matriz de confusión Clase de predicción Clase de predicción (entrenamiento) (prueba) Clase real Conteo Sí No %Correcto Sí No %Correcto Sí (Evento) 139 117 22 84.2 105 34 75.5 No 164 22 142 86.6 24 140 85.4 Todo 303 139 164 85.5 129 174 80.9 Entrenamiento Estadísticas (%) Tasa de positivos verdaderos (sensibilidad o potencia) 84.2 Tasa de positivos falsos (error tipo I) 13.4 Tasa de negativos falsos (error tipo II) 15.8 Tasa de negativos verdaderos (especificidad) 86.6
Estadísticas Prueba (%) Tasa de positivos verdaderos (sensibilidad o potencia) 75.5 Tasa de positivos falsos (error tipo I) 14.6 Tasa de negativos falsos (error tipo II) 24.5 Tasa de negativos verdaderos (especificidad) 85.4

En este ejemplo, el número total de eventos Sí es 139 y el número total de eventos No es 164.
  • En los datos de capacitación, el número de eventos Sí pronosticados es 117, que es 84,2% correcto.
  • En los datos de capacitación, el número de eventos No pronosticados es 142, que es 86,6% correcto.
  • En los datos de prueba, el número de eventos Sí pronosticados es 105, que es 75,5% correcto.
  • En los datos de prueba, el número de eventos No pronosticados es 140, que es 80,9% correcto.
En general, el %Correcto para los datos de capacitación es 85,5% y 80,9% para los datos de prueba.
  • Tasa de verdaderos positivos (TPR): 84,2% para los datos de capacitación y 75,5% para los datos de prueba.
  • Tasa de falsos positivos (FPR): 13,4% para los datos de capacitación y 14,6% para los datos de prueba.