Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
Use Classificação TreeNet® para produzir árvore de classificação com gradient boosting para uma resposta categórica com muitas variáveis preditoras contínuas e categóricas. Classificação TreeNet® é um avanço revolucionário na tecnologia de mineração de dados desenvolvida por Jerome Friedman, um dos mais proeminentes pesquisadores mundiais em mineração de dados. Esta ferramenta de mineração de dados flexível e poderosa é capaz de gerar modelos extremamente precisos com velocidade excepcional e uma alta tolerância a dados confusos e incompletos.
Por exemplo, um pesquisador de mercado pode usar Classificação TreeNet® para identificar clientes que têm taxas de resposta mais altas a iniciativas específicas e predizer essas taxas de resposta.
Classificação CART® é uma boa ferramenta de análise exploratória de dados e oferece um modelo fácil de entender para identificar rapidamente preditores importantes. No entanto, após a exploração inicial com Classificação CART®, considere Classificação TreeNet® como um passo de acompanhamento necessário. Classificação TreeNet® produz um modelo de alto desempenho e mais complexo que pode consistir em várias centenas de árvores pequenas. Cada árvore contribui com uma pequena quantidade para o modelo global. Com base nos resultados de Classificação TreeNet®, é possível obter insights sobre a relação entre uma resposta categórica e os preditores considerados importantes entre muitos preditores candidatos, e predizer probabilidades de classe de resposta para novas observações com grande exatidão.
A análise de Classificação TreeNet® fornece gráficos de dependência parcial com um e dois preditores. Esses gráficos ajudam a avaliar como as mudanças das principais variáveis preditoras afetam os valores de resposta. Assim, essas informações podem ser úteis para controlar as configurações que permitem o resultado ótimo da produção.
A análise Classificação TreeNet® também fornece a capacidade de experimentar diferentes hiperparâmetros para um modelo. A taxa de aprendizado e a fração de subamostra são exemplos de hiperparâmetros. A exploração de diferentes valores é um método comum para melhorar o desempenho do modelo.
Para uma introdução mais completa à metodologia CART®, veja Breiman, Friedman, Olshen e Stone (1984)1 e 2
Use Ajuste de modelo para construir um único modelo de árvore de classificação incrementada por gradiente para uma resposta categórica com muitas variáveis preditoras contínuas e categóricas. Os resultados são para o modelo do processo de aprendizagem com a máxima log-verossimilhança, a área máxima sob a curva ROC ou a taxa mínima de classificação errada.
Para um conjunto de dados com muitos preditores, em que alguns preditores têm menos efeito sobre a resposta do que outros, considere o uso de Descubrir preditores-chave para eliminar preditores sem importância do modelo. A remoção dos preditores sem importância ajuda a esclarecer os efeitos dos preditores mais importantes e melhora a precisão da predição. O algoritmo remove os preditores menos importantes de forma sequencial, mostra resultados que permitem comparar modelos com diferentes números de preditores e produz resultados para o conjunto de preditores com o melhor valor do critério de precisão.
Por exemplo, um pesquisador de mercado usa Descubrir preditores-chave para identificar automaticamente uma dúzia de preditores de um conjunto de 500 preditores que modelam efetivamente quais clientes têm taxas de resposta mais altas para iniciativas específicas.
Descubrir preditores-chave também pode remover os preditores mais importantes para avaliar quantitativamente o efeito de cada preditor importante na precisão da predição de um modelo.
Para realizar um Ajuste de modelo, escolha .
Para realizar um Descubrir preditores-chave, escolha .
Se você quiser experimentar um modelo de regressão paramétrica com uma variável resposta binária, use Ajustar modelo logístico binário.
Para comparar o desempenho de um modelo de classificação Random Forests®, use Classificação Random Forests®