Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
O gráfico de área sob curva ROC vs número de árvores mostra a área sob a curva ROC no eixo y e o número de árvores no eixo x. A área sob uma curva ROC indica se o modelo é um bom classificador. Quando a análise utiliza um método de validação, o gráfico inclui uma linha para os resultados da validação. Use os resultados da validação para avaliar o desempenho do modelo e prever novas observações. Compare os resultados do treinamento e os resultados do validação para ver se há problemas de sobreajuste com o modelo para o conjunto de dados de treinamento.
Quando o valor da máxima verossimilhança determina o número de árvores para o modelo ótimo, o Minitab exibe o gráfico de log-verossimilhança médio vs número de árvores. Quando a taxa mínima de classificação errada determina o número de árvores para o modelo ótimo, o Minitab exibe o gráfico Taxa de Classificação Incorreta em relação ao Número de Árvores.
Para árvores de classificação, a área sob os valores da curva ROC variam tipicamente de 0,5 a 1. Os valores maiores indicam um modelo de ajuste melhor. Quando o modelo consegue separar perfeitamente as classes, a área sob a curva é 1. Quando o modelo não consegue separar as classes melhor do que uma atribuição aleatória, a área sob a curva é 0,5.
A linha de referência indica a área ótima sob a curva ROC para os dados de teste e o número de árvores no modelo.
Idealmente, a curva dos resultados de validação aumenta conforme o número de árvores aumenta e então atinge um máximo antes de nivelar ou diminuir em alguns casos. Se o máximo para a curva dos resultados de validação não for ideal, tente ajustar as taxas de aprendizado e as frações de subamostragem para comparar.