Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
Use Regressão TreeNet® para produzir árvore de regressão com gradient boosting para uma resposta contínua com muitas variáveis preditoras contínuas e categóricas. Regressão TreeNet® é um avanço revolucionário na tecnologia de mineração de dados desenvolvida por Jerome Friedman, um dos mais proeminentes pesquisadores mundiais em mineração de dados. Esta ferramenta de mineração de dados flexível e poderosa é capaz de gerar modelos extremamente precisos com velocidade excepcional e uma alta tolerância a dados confusos e incompletos.
Por exemplo, um pesquisador médico pode usar Regressão TreeNet® para identificar pacientes que têm taxas de resposta mais altas a tratamentos específicos e predizer essas taxas de resposta.
Regressão CART® é uma boa ferramenta de análise exploratória de dados e oferece um modelo fácil de entender para identificar rapidamente preditores importantes. No entanto, após a exploração inicial com Regressão CART®, considere Regressão TreeNet® como um passo de acompanhamento necessário. Regressão TreeNet® produz um modelo de alto desempenho e mais complexo que pode consistir em várias centenas de árvores pequenas. Cada árvore contribui com uma pequena quantidade para o modelo global. Com base nos resultados de Regressão TreeNet®, é possível obter insights sobre a relação entre uma resposta contínua e os preditores considerados importantes entre muitos preditores candidatos, e predizer respostas para novas observações com grande exatidão.
A análise de Regressão TreeNet® fornece gráficos de dependência parcial com um e dois preditores. Esses gráficos ajudam a avaliar como as mudanças das principais variáveis preditoras afetam os valores de resposta. Assim, essas informações podem ser úteis para controlar as configurações que permitem o resultado ótimo da produção.
A análise Regressão TreeNet® também fornece a capacidade de experimentar diferentes hiperparâmetros para um modelo. A taxa de aprendizado e a fração de subamostra são exemplos de hiperparâmetros. A exploração de diferentes valores é um método comum para melhorar o desempenho do modelo.
Para uma introdução mais completa à metodologia CART®, veja Breiman, Friedman, Olshen e Stone (1984)1 e 2
Use Ajuste de modelo para produzir árvore de regressão com gradient boosting para uma resposta contínua com muitas variáveis preditoras contínuas e categóricas. Os resultados são para o modelo do processo de aprendizagem com o valor máximo R2 ou o desvio absoluto mínimo.
Para um conjunto de dados com muitos preditores, em que alguns preditores têm menos efeito sobre a resposta do que outros, considere o uso de Descubrir preditores-chave para eliminar preditores sem importância do modelo. A remoção dos preditores sem importância ajuda a esclarecer os efeitos dos preditores mais importantes e melhora a precisão da predição. O algoritmo remove os preditores menos importantes de forma sequencial, mostra resultados que permitem comparar modelos com diferentes números de preditores e produz resultados para o conjunto de preditores com o melhor valor do critério de precisão.
Por exemplo, um químico usa Descubrir preditores-chave para identificar automaticamente uma dúzia de preditores de um conjunto de 500 preditores que efetivamente modelam a viscosidade em uma nova mistura de combustível.
Descubrir preditores-chave também pode remover os preditores mais importantes para avaliar quantitativamente o efeito de cada preditor importante na precisão da predição de um modelo.
Para realizar um Ajuste de modelo, escolha .
Para realizar um Descubrir preditores-chave, escolha .
Se você quiser experimentar um modelo de regressão paramétrica com uma variável resposta contínua, use Ajuste do modelo de regressão.
Para comparar o desempenho de um modelo de regressão Random Forests®, use Regressão Random Forests®.