Use os gráficos de ganho e de elevação para avaliar o desempenho do seu modelo de classificação. O gráfico de ganho mostra a taxa total de positivos em porcentagem versus a porcentagem das contagens totais. Assim, por exemplo, esses gráficos podem mostrar que 80% dos eventos estão em 20% dos dados. Assim, focando em 20% dos dados, podemos ser eficientes com nossos recursos. O gráfico de elevação apresenta a elevação acumulada (ou não acumulada) em função da porcentagem de contagem total.
Interpretação do gráfico de ganho
Quando a análise utiliza um método de validação, o gráfico possui uma linha para os dados de treinamento e outra para os resultados da validação. As linhas de treinamento e validação representam a resposta esperada usando o modelo preditivo. O conjunto de dados de treinamento se ajusta ao modelo e os resultados de validação avaliam o modelo. A linha de referência pontilhada representa uma linha com inclinação = 1, que é a resposta aleatória esperada sem o modelo. Ganhos maiores que 1 indicam que os resultados do modelo preditivo são melhores do que do modelo aleatório.
Neste exemplo, o gráfico de ganho mostra um aumento acentuado acima da linha de referência, em seguida, um achatamento. Neste caso, aproximadamente 40% dos dados representam aproximadamente 70% dos positivos verdadeiros.
Interpretação do gráfico de elevação
Quando a análise utiliza um método de validação, o gráfico possui uma linha para os dados de treinamento e outra para os resultados da validação. As linhas de treinamento e validação representam a resposta esperada usando o modelo preditivo. O conjunto de dados de treinamento se ajusta ao modelo e os resultados de validação avaliam o modelo. Elevação é a razão da porcentagem de ganho em relação ao resultado aleatório esperado. A linha de referência pontilhada representa um levantamento acumulado de 1, o que significa que não há ganho em comparação com o aleatório.
Neste exemplo, o gráfico de elevação mostra um aumento acima da linha de referência que cai gradualmente.