Visão geral de Ajuste de modelo e Descubrir preditores-chave para Classificação TreeNet®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Use Classificação TreeNet® para produzir árvore de classificação com gradient boosting para uma resposta categórica com muitas variáveis preditoras contínuas e categóricas. Classificação TreeNet® é um avanço revolucionário na tecnologia de mineração de dados desenvolvida por Jerome Friedman, um dos mais proeminentes pesquisadores mundiais em mineração de dados. Esta ferramenta de mineração de dados flexível e poderosa é capaz de gerar modelos extremamente precisos com velocidade excepcional e uma alta tolerância a dados confusos e incompletos.

Por exemplo, um pesquisador de mercado pode usar Classificação TreeNet® para identificar clientes que têm taxas de resposta mais altas a iniciativas específicas e predizer essas taxas de resposta.

Classificação CART® é uma boa ferramenta de análise exploratória de dados e oferece um modelo fácil de entender para identificar rapidamente preditores importantes. No entanto, após a exploração inicial com Classificação CART®, considere Classificação TreeNet® como um passo de acompanhamento necessário. Classificação TreeNet® produz um modelo de alto desempenho e mais complexo que pode consistir em várias centenas de árvores pequenas. Cada árvore contribui com uma pequena quantidade para o modelo global. Com base nos resultados de Classificação TreeNet®, é possível obter insights sobre a relação entre uma resposta categórica e os preditores considerados importantes entre muitos preditores candidatos, e predizer probabilidades de classe de resposta para novas observações com grande exatidão.

A análise de Classificação TreeNet® fornece gráficos de dependência parcial com um e dois preditores. Esses gráficos ajudam a avaliar como as mudanças das principais variáveis preditoras afetam os valores de resposta. Assim, essas informações podem ser úteis para controlar as configurações que permitem o resultado ótimo da produção.

A análise Classificação TreeNet® também fornece a capacidade de experimentar diferentes hiperparâmetros para um modelo. A taxa de aprendizado e a fração de subamostra são exemplos de hiperparâmetros. A exploração de diferentes valores é um método comum para melhorar o desempenho do modelo.

Para uma introdução mais completa à metodologia CART®, veja Breiman, Friedman, Olshen e Stone (1984)1 e 2

Ajuste de modelo

Use Ajuste de modelo para construir um único modelo de árvore de classificação incrementada por gradiente para uma resposta categórica com muitas variáveis preditoras contínuas e categóricas. Os resultados são para o modelo do processo de aprendizagem com a máxima log-verossimilhança, a área máxima sob a curva ROC ou a taxa mínima de classificação errada.

Descubrir preditores-chave

Para um conjunto de dados com muitos preditores, em que alguns preditores têm menos efeito sobre a resposta do que outros, considere o uso de Descubrir preditores-chave para eliminar preditores sem importância do modelo. A remoção dos preditores sem importância ajuda a esclarecer os efeitos dos preditores mais importantes e melhora a precisão da predição. O algoritmo remove os preditores menos importantes de forma sequencial, mostra resultados que permitem comparar modelos com diferentes números de preditores e produz resultados para o conjunto de preditores com o melhor valor do critério de precisão.

Por exemplo, um pesquisador de mercado usa Descubrir preditores-chave para identificar automaticamente uma dúzia de preditores de um conjunto de 500 preditores que modelam efetivamente quais clientes têm taxas de resposta mais altas para iniciativas específicas.

Descubrir preditores-chave também pode remover os preditores mais importantes para avaliar quantitativamente o efeito de cada preditor importante na precisão da predição de um modelo.

Onde encontrar essa análise

Para realizar um Ajuste de modelo, escolha Módulo de análise preditiva > Classificação TreeNet® > Ajuste de modelo.

Para realizar um Descubrir preditores-chave, escolha Módulo de análise preditiva > Classificação TreeNet® > Descobrir preditores principais.

Quando usar uma análise alternativa

Se você quiser experimentar um modelo de regressão paramétrica com uma variável resposta binária, use Ajustar modelo logístico binário.

Para comparar o desempenho de um modelo de classificação Random Forests®, use Classificação Random Forests®

1 Breiman, Friedman, Olshen e Stone. (1984). Classification and Regression Trees. Boca Raton, Florida: Chapman & Hall/CRC.
2 H. Zhang and B.H. Singer. (2010). Recursive Partitioning and Applications. Nova York, Nova York: Springer.