Otimização de hiperparâmetros para Ajuste de modelo e Descubrir preditores-chave com Regressão TreeNet®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Use os resultados para comparar o desempenho dos modelos com diferentes configurações para os hiperparâmetros. Clique em Sintonizar hiperparâmetros para identificar um modelo melhor para avaliar valores adicionais dos hiperparâmetros.

Número ótimo de árvores

O número ótimo de árvores geralmente difere a cada passo. Quando o número ótimo está próximo do número máximo de árvores para a análise, o modelo é mais provável de melhorar se você aumentar o número de árvores em vez de usar um modelo com um número ótimo de árvores que está longe do máximo. Você pode considerar se deve explorar um modelo alternativo que parece provável que melhore.

R-quadrado (%)

R2 é a porcentagem de variação na resposta que o modelo explica. Os outliers têm um efeito maior sobre R2 do que sobre o DAM.

Quando você usa a função de perda de erro quadrado ou a função de perda Huber, a tabela inclui o valor R2 para cada modelo. Os resultados a seguir são para o modelo com o maior valor de R2.

DAM

O desvio absoluto médio (DAM) é a média do valor absoluto da diferença entre um valor previsto e um valor real. Quanto menor o DAM, melhor o modelo se ajusta aos dados. O DAM expressa precisão nas mesmas unidades dos dados, o que ajuda a conceituar a magnitude do erro. Os outliers têm menos efeito sobre o DAM do que sobre o R2.

Quando você usa a função de perda de desvio absoluto, a tabela inclui o valor de DAM para cada modelo. Os resultados completos que seguem a tabela são para o modelo com o menor valor de DAM.

Taxa de aprendizado

As taxas de aprendizado baixas pesam cada nova árvore no modelo menos do que as taxas de aprendizado mais altas e, às vezes, produzem mais árvores para o modelo. Um modelo com taxa de aprendizagem baixa tem menos chance de sobreajustar o conjunto de dados de treinamento. Modelos com baixas taxas de aprendizado geralmente usam mais árvores para encontrar o número ótimo de árvores.

Fração da subamostra

A fração da subamostra é a proporção dos dados que a análise usa para construir cada árvore.

Máximo de nós terminais por árvore

Regressão TreeNet® combina muitas árvores CART® pequenas em um modelo poderoso. Você pode especificar o número máximo de nós terminais ou a profundidade máxima da árvore para essas árvores CART® menores. Árvores com nós mais terminais podem modelar interações mais complexas. Em geral, valores acima de 12 poderiam retardar a análise sem muito benefício para o modelo.

Profundidade máxima da árvore

Regressão TreeNet® combina muitas árvores CART® pequenas em um modelo poderoso. Você pode especificar o número máximo de nós terminais ou a profundidade máxima da árvore para essas árvores CART® menores. Árvores mais profundas podem modelar interações mais complexas. Valores de 4 a 6 são adequados para muitos conjuntos de dados.