Matriz de confusão para Classificação Random Forests®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

A matriz confusão mostra se a árvore separa as classes bem e corretamente usando essas métricas:
  • Taxa de positivos verdadeiros (TPR) — a probabilidade da ocorrência de um evento seja predita corretamente
  • Taxa de falsos positivos (FPR) — a probabilidade de que a ocorrência de um não evento seja predita incorretamente
  • Taxa falsos negativos (FNR) — a probabilidade de que a ocorrência de um evento seja predita incorretamente
  • Taxa de negativos verdadeiros (TNR) — a probabilidade de que a ocorrência de não evento seja predita corretamente

Interpretação

Classificação Random Forests®: Doença cardí vs Idade; Pressão Arte; ...

Matriz de confusão Classe predita (Out-of-Bag) Classe real Contagem Sim Não % Correto Sim (Evento) 139 109 30 78,42 Não 164 26 138 84,15 Tudo 303 135 168 81,52 Out-of-Bag Estatística (%) Taxa de positivo verdadeiro (sensibil. ou poder) 78,42 Taxa de positivo falso (erro tipo I) 15,85 Taxa de negativo falso (erro tipo II) 21,58 Taxa de negativo verdadeiro (especificidade) 84,15

Neste exemplo, o número total de eventos Sim é de 139, e o número total de Não é de 164. A análise usa dados out-of-bag para validar o modelo.

Nos dados out-of-bag, o número total de eventos Sim é 139 e o número total de resultados Não é 164.
  • O número de eventos preditos (Sim) nos dados out-of-bag é de 109, o que é 78,42% correto.
  • O número de não eventos preditos (Não) nos dados out-of-bag é de 138, o que é 84,15% correto.

No geral, %Corretos para os dados out-of-bag é de 81,52%. Use os resultados para os dados out-of-bag para avaliar a exatidão da predição para as novas observações.

Em geral, um valor baixo para %Corretos se deve a um modelo ajustado deficiente. Vários problemas levam a um modelo deficiente. Se %Corretos for muito baixo, considere se deve modificar o número mínimo de casos para dividir um nó interno ou alterar o número de preditores que a análise considera para a divisão de um nó.