Matriz de confusão para Classificação Random Forests®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

A matriz confusão mostra se a árvore separa as classes bem e corretamente usando essas métricas:
  • Taxa de positivos verdadeiros (TPR) — a probabilidade da ocorrência de um evento seja predita corretamente
  • Taxa de falsos positivos (FPR) — a probabilidade de que a ocorrência de um não evento seja predita incorretamente
  • Taxa falsos negativos (FNR) — a probabilidade de que a ocorrência de um evento seja predita incorretamente
  • Taxa de negativos verdadeiros (TNR) — a probabilidade de que a ocorrência de não evento seja predita corretamente

Interpretação

Matriz de confusão


Classe predita (Out-of-Bag)
Classe realContagemSimNão% Correto
Sim (Evento)1391093078,42
Não1642613884,15
Todos30313516881,52
EstatísticasOut-of-Bag
(%)
Taxa de positivo verdadeiro (sensibil. ou poder)78,42
Taxa de positivo falso (erro tipo I)15,85
Taxa de negativo falso (erro tipo II)21,58
Taxa de negativo verdadeiro (especificidade)84,15

Neste exemplo, o número total de eventos Sim é de 139, e o número total de Não é de 164. A análise usa dados out-of-bag para validar o modelo.

Nos dados out-of-bag, o número total de eventos Sim é 139 e o número total de resultados Não é 164.
  • O número de eventos preditos (Sim) nos dados out-of-bag é de 109, o que é 78,42% correto.
  • O número de não eventos preditos (Não) nos dados out-of-bag é de 138, o que é 84,15% correto.

No geral, %Corretos para os dados out-of-bag é de 81,52%. Use os resultados para os dados out-of-bag para avaliar a exatidão da predição para as novas observações.

Em geral, um valor baixo para %Corretos se deve a um modelo ajustado deficiente. Vários problemas levam a um modelo deficiente. Se %Corretos for muito baixo, considere se deve modificar o número mínimo de casos para dividir um nó interno ou alterar o número de preditores que a análise considera para a divisão de um nó.