Gráfico de ganho e gráfico de elevação para Classificação CART®

Use os gráficos de ganho e de elevação para avaliar o desempenho do seu modelo de classificação. O gráfico de ganho representa a taxa positiva total em porcentagem versus a porcentagem das contagens totais. Assim, por exemplo, esses gráficos podem mostrar que 80% dos eventos estão em 20% dos dados. Assim, focando em 20% dos dados, podemos ser eficientes com nossos recursos. O gráfico de elevação representa o ganho acumulado (ou ganho não acumulado) em comparação com a porcentagem da contagem total.

Interpretação do gráfico de ganho

As linhas de treinamento e de teste representam a resposta esperada usando o modelo preditivo. O conjunto de dados de treinamento ajusta o modelo, e o conjunto de dados de teste avalia o modelo. A linha de referência pontilhada representa uma linha com inclinação = 1, que é a resposta aleatória esperada sem o modelo. Ganhos maiores que 1 indicam que os resultados do modelo preditivo são melhores do que do modelo aleatório.

Neste exemplo, o gráfico de ganho mostra um aumento acentuado acima da linha de referência, em seguida, um achatamento. Neste caso, aproximadamente 40% dos dados representam aproximadamente 70% dos positivos verdadeiros.

Interpretação do gráfico de elevação

As linhas de treinamento e de teste representam a resposta esperada usando o modelo preditivo. O conjunto de dados de treinamento ajusta o modelo, e o conjunto de dados de teste avalia o modelo. Elevação é a razão da porcentagem de ganho em relação ao resultado aleatório esperado. A linha de referência pontilhada representa uma elevação acumulada de 1, o que significa que não há ganho em comparação com resultado aleatório.

Neste exemplo, o gráfico de elevação mostra um aumento acima da linha de referência que cai gradualmente.