Matriz de confusión para Ajustar modelo y Descubrir predictores clave con Clasificación TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Busque definiciones e interpretaciones para cada estadístico en la matriz de confusión.
La matriz de confusión muestra qué tan bien el árbol separa correctamente las clases utilizando estas métricas:
  • Tasa de verdaderos positivos (TPR): la probabilidad de que un caso de evento se pronostique correctamente
  • Tasa de falsos positivos (FPR) — la probabilidad de que un caso de no evento se pronostique erróneamente
  • Tasa de falsos negativos (FNR) — la probabilidad de que un caso de evento se pronostique erróneamente
  • Tasa de verdaderos negativos (TNR): la probabilidad de que un caso de no evento se pronostique correctamente

Interpretación

Clasificación de TreeNet®: Enfermedad c vs Edad, Descansar la, Colesterol, ...

Matriz de confusión Clase de predicción Clase de predicción (entrenamiento) (prueba) Clase real Conteo Sí No % Correcto Sí No % Correcto Sí (Evento) 139 124 15 89.21 110 29 79.14 No 164 8 156 95.12 24 140 85.37 Todo 303 132 171 92.41 134 169 82.51 Asigne una fila a la clase de evento si la probabilidad del evento para la fila es mayor que 0.5.
Entrenamiento Estadísticas (%) Tasa de positivos verdaderos (sensibilidad o potencia) 89.21 Tasa de positivos falsos (error tipo I) 4.88 Tasa de negativos falsos (error tipo II) 10.79 Tasa de negativos verdaderos (especificidad) 95.12
Estadísticas Prueba (%) Tasa de positivos verdaderos (sensibilidad o potencia) 79.14 Tasa de positivos falsos (error tipo I) 14.63 Tasa de negativos falsos (error tipo II) 20.86 Tasa de negativos verdaderos (especificidad) 85.37

En este ejemplo, el número total de eventos Sí es 139 y el número total de No es 164.
  • En los datos de entrenamiento, el número de eventos pronosticados (Sí) es 124, que es 89.21% correcto.
  • En los datos de entrenamiento, el número de no eventos pronosticados (No) es 156, que es 95.12% correcto.
  • En los datos de prueba, el número de eventos pronosticados (Sí) es 110, que es 79.14% correcto.
  • En los datos de prueba, el número de no eventos pronosticados (No) es 140, que es 85.37% correcto.
En general, el %Correcto para los datos de entrenamiento es 92.41% y 82.51% para los datos de prueba. Utilice los resultados de los datos de prueba para evaluar la exactitud de la predicción para nuevas observaciones.

Un valor bajo de % Correcto se debe generalmente a un modelo ajustado deficiente, que puede ser causado por varias razones diferentes. Si el % Correcto es muy bajo, considere si las ponderaciones de clase podrían ayudar. Los ponderaciones de clase pueden ayudar a proporcionar un modelo más exacto cuando las observaciones de una clase tienen mayor ponderación que las observaciones de otra clase. También puede cambiar la probabilidad cuando se requiera para que un caso sea clasificado como el evento.