Gráfico de área sob curva ROC vs número de árvores para Ajuste de modelo e Descubrir preditores-chave com Classificação TreeNet®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

O gráfico de área sob curva ROC vs número de árvores mostra a área sob a curva ROC no eixo y e o número de árvores no eixo x. A área sob uma curva ROC indica se o modelo é um bom classificador. Use os resultados do teste para avaliar o desempenho do modelo em novas observações. Compare os resultados do treinamento e os resultados do teste para ver se há problemas de sobreajuste com o modelo para o conjunto de dados de treinamento.

Quando o valor da máxima verossimilhança determina o número de árvores para o modelo ótimo, o Minitab exibe o gráfico de log-verossimilhança médio vs número de árvores. Quando o taxa mínima de classificação errada determina o número de árvores para o modelo ótimo, o Minitab exibe o gráfico da taxa de classificação errada vs número de árvores.

Interpretação

Para árvores de classificação, a área sob os valores da curva ROC variam tipicamente de 0,5 a 1. Os valores maiores indicam um modelo de ajuste melhor. Quando o modelo consegue separar perfeitamente as classes, a área sob a curva é 1. Quando o modelo não consegue separar as classes melhor do que uma atribuição aleatória, a área sob a curva é 0,5.

A linha de referência indica a área ótima sob a curva ROC para os dados de teste e o número de árvores no modelo.

Em uma situação ideal, a curva de teste aumenta à medida que o número de árvores aumenta, atingindo um máximo antes de nivelar ou diminuir em alguns casos. Se o máximo para a curva de teste não for o ideal, tente ajustar as taxas de aprendizado e extraia subamostras de frações para comparar.