Matriz de confusão Classificação CART®

Encontre definições e interpretações para cada estatística da matriz Confusão.
A matriz confusão mostra se a árvore separa as classes bem e corretamente usando essas métricas:
  • Taxa de positivos verdadeiros (TPR) — a probabilidade da ocorrência de um evento seja predita corretamente
  • Taxa de falsos positivos (FPR) — a probabilidade de que a ocorrência de um não evento seja predita incorretamente
  • Taxa falsos negativos (FNR) — a probabilidade de que a ocorrência de um evento seja predita incorretamente
  • Taxa de negativos verdadeiros (TNR) — a probabilidade de que a ocorrência de não evento seja predita corretamente

Interpretação

CART® classificação de 7 nós: Doença cardíaca versus Idade; Pressão Arterial de descanso; Colesterol; Max Heart Rate; Pico Antigo; Sexo; Açúcar no sangue em jejum; Exercício Angina; Resto ECG; Inclinação; Thal; Tipo de dor torácica; Principais Navios

Matriz de confusão Classe predita (Treinamento) Classe predita (Teste) Classe real Contagem Sim Não %Correto Sim Não %Correto Sim (Evento) 139 117 22 84,2 105 34 75,5 Não 164 22 142 86,6 24 140 85,4 Todos 303 139 164 85,5 129 174 80,9 Treinamento Estatísticas (%) Teste (%) Taxa de positivo verdadeiro (sensibilidade ou poder) 84,2 75,5 Taxa de positivo falso (erro tipo I) 13,4 14,6 Taxa de negativo falso (erro tipo II) 15,8 24,5 Taxa de negativo verdadeiro (especificidade) 86,6 85,4

Neste exemplo, o número total de eventos Sim é de 139, e o número total de eventos Não é de 164.
  • Nos dados de treinamento, o número de eventos Sim previstos é de 117, uma taxa de correção de 84,2%.
  • Nos dados de treinamento, o número de eventos Não previstos é de 142, uma taxa de correção de 86,6%.
  • Nos dados de teste, o número de eventos Sim previstos é de 105, uma taxa de correção de 75,5%.
  • Nos dados de teste, o número de eventos Não previstos é de 140, uma taxa de correção de 80,9%.
No geral, o %Corretos para os dados de treinamento é de 85,5% e para os dados do teste é de 80,9%.
  • Taxa de positivos verdadeiros (TPR) — 84,2% para os dados de treinamento e 75,5% para os dados de teste.
  • Taxa de falsos positivos (FPR) — 13,4% para os dados de treinamento e 14,6% para os dados de teste.