Matriz de confusión para Clasificación Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

La matriz de confusión muestra qué tan bien el árbol separa correctamente las clases utilizando estas métricas:
  • Tasa de verdaderos positivos (TPR): la probabilidad de que un caso de evento se pronostique correctamente
  • Tasa de falsos positivos (FPR) — la probabilidad de que un caso de no evento se pronostique erróneamente
  • Tasa de falsos negativos (FNR) — la probabilidad de que un caso de evento se pronostique erróneamente
  • Tasa de verdaderos negativos (TNR): la probabilidad de que un caso de no evento se pronostique correctamente

Interpretación

Random Forests® Clasificación: Enfermedad c vs Edad, Descansar la, ...

Matriz de confusión Clase de predicción (Out-of-Bag) Clase real Conteo Sí No % Correcto Sí (Evento) 139 109 30 78.42 No 164 26 138 84.15 Todo 303 135 168 81.52 Out-of-Bag Estadísticas (%) Tasa de positivos verdaderos (sensibilidad o potencia) 78.42 Tasa de positivos falsos (error tipo I) 15.85 Tasa de negativos falsos (error tipo II) 21.58 Tasa de negativos verdaderos (especificidad) 84.15

En este ejemplo, el número total de eventos Sí es 139 y el número total de No es 164. El análisis utiliza datos out-of-bag para validar el modelo.

En los datos out-of-bag, el número total de eventos Sí es 139 y el número total de resultados No es 164.
  • El número de eventos pronosticados (Sí) en los datos out-of-bag es 109, que significa el 78.42% correcto.
  • El número de no eventos pronosticados (No) en los datos out-of-bag es 138, que significa el 84.15% correcto.

En general, el %Correcto para los datos out-of-bag es 81.52%. Utilice los resultados de los datos out-of-bag para evaluar la precisión de la predicción para observaciones nuevas.

Un valor bajo de % Correcto se debe generalmente a un modelo ajustado deficiente. Varios problemas conducen a un modelo deficiente. Si el % Correcto es muy bajo, considere si desea modificar el número mínimo de casos para dividir un nodo interno o cambiar el número de predictores que el análisis considera para dividir un nodo.