Métodos e fórmulas para a matriz de confusão em Ajuste de modelo e Descubrir preditores-chave com Classificação TreeNet®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Escolha o método ou fórmula de sua preferência.

A matriz de confusão contém os resultados sobre a exatidão da classificação do modelo. Na maioria dos casos, a classificação de uma linha é o nível de resposta com a maior probabilidade predita. Por exemplo, com uma resposta binária, a classificação da linha é a categoria de evento quando a probabilidade predita do evento excede 0,50. No entanto, para uma resposta binária, você pode especificar um limite diferente de 0,50.

Contagem

Quando não há pesos, as contagens e os tamanhos das amostras são os mesmos.

Contagem ponderada

No caso ponderado, a contagem ponderada é a soma dos pesos para uma categoria. Use os pesos para calcular percentagens e taxas. Considere o seguinte exemplo simples:
Nível de resposta Nível predito Peso
Sim Sim 0,1
Sim Sim 0,2
Sim Não 0,3
Sim Não 0,4
Não Não 0,5
Não Não 0,6
Não Sim 0,7
Não Sim 0,8
Esta tabela fornece as seguintes estatísticas
Classe real Contagem ponderada Classe predita = Sim Classe predita = Não Por cento correto
Sim 0,1 + 0,2 + 0,3 + 0,4 = 1 0,1 + 0,2 = 0,3 0,3 + 0,4 = 0,7 0,3 / (0,3 + 0,7) ×100 = 30,00%
Não 0,5 + 0,6 + 0,7 + 0,8 = 2,6 0,7 + 0,8 = 1,5 0,5 + 0,6 = 1,1 1,1 / (1,5 + 1,1) × 100 = 42,31%
Todas 1 + 2,6 = 3,6 0,3 + 1,5 = 1,8 0,7 + 1,1 = 1,8 (0,3 + 1,1) / 3,6 × 100 = 38,89%

Taxa de positivos verdadeiros (sensibilidade ou poder)

Taxa de falsos positivos (erro tipo I)

Taxa de falsos negativos (erro tipo II)

Taxa de negativos verdadeiros (especificidade)

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política