Visão geral de Ajuste de modelo e Descubrir preditores-chave para Regressão TreeNet®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Use Regressão TreeNet® para produzir árvore de regressão com gradient boosting para uma resposta contínua com muitas variáveis preditoras contínuas e categóricas. Regressão TreeNet® é um avanço revolucionário na tecnologia de mineração de dados desenvolvida por Jerome Friedman, um dos mais proeminentes pesquisadores mundiais em mineração de dados. Esta ferramenta de mineração de dados flexível e poderosa é capaz de gerar modelos extremamente precisos com velocidade excepcional e uma alta tolerância a dados confusos e incompletos.

Por exemplo, um pesquisador médico pode usar Regressão TreeNet® para identificar pacientes que têm taxas de resposta mais altas a tratamentos específicos e predizer essas taxas de resposta.

Regressão CART® é uma boa ferramenta de análise exploratória de dados e oferece um modelo fácil de entender para identificar rapidamente preditores importantes. No entanto, após a exploração inicial com Regressão CART®, considere Regressão TreeNet® como um passo de acompanhamento necessário. Regressão TreeNet® produz um modelo de alto desempenho e mais complexo que pode consistir em várias centenas de árvores pequenas. Cada árvore contribui com uma pequena quantidade para o modelo global. Com base nos resultados de Regressão TreeNet®, é possível obter insights sobre a relação entre uma resposta contínua e os preditores considerados importantes entre muitos preditores candidatos, e predizer respostas para novas observações com grande exatidão.

A análise de Regressão TreeNet® fornece gráficos de dependência parcial com um e dois preditores. Esses gráficos ajudam a avaliar como as mudanças das principais variáveis preditoras afetam os valores de resposta. Assim, essas informações podem ser úteis para controlar as configurações que permitem o resultado ótimo da produção.

A análise Regressão TreeNet® também fornece a capacidade de experimentar diferentes hiperparâmetros para um modelo. A taxa de aprendizado e a fração de subamostra são exemplos de hiperparâmetros. A exploração de diferentes valores é um método comum para melhorar o desempenho do modelo.

Para uma introdução mais completa à metodologia CART®, veja Breiman, Friedman, Olshen e Stone (1984)1 e 2

Ajuste de modelo

Use Ajuste de modelo para produzir árvore de regressão com gradient boosting para uma resposta contínua com muitas variáveis preditoras contínuas e categóricas. Os resultados são para o modelo do processo de aprendizagem com o valor máximo R2 ou o desvio absoluto mínimo.

Descubrir preditores-chave

Para um conjunto de dados com muitos preditores, em que alguns preditores têm menos efeito sobre a resposta do que outros, considere o uso de Descubrir preditores-chave para eliminar preditores sem importância do modelo. A remoção dos preditores sem importância ajuda a esclarecer os efeitos dos preditores mais importantes e melhora a precisão da predição. O algoritmo remove os preditores menos importantes de forma sequencial, mostra resultados que permitem comparar modelos com diferentes números de preditores e produz resultados para o conjunto de preditores com o melhor valor do critério de precisão.

Por exemplo, um químico usa Descubrir preditores-chave para identificar automaticamente uma dúzia de preditores de um conjunto de 500 preditores que efetivamente modelam a viscosidade em uma nova mistura de combustível.

Descubrir preditores-chave também pode remover os preditores mais importantes para avaliar quantitativamente o efeito de cada preditor importante na precisão da predição de um modelo.

Onde encontrar essa análise

Para realizar um Ajuste de modelo, escolha Módulo de análise preditiva > Regressão TreeNet® > Ajuste de modelo.

Para realizar um Descubrir preditores-chave, escolha Módulo de análise preditiva > Regressão TreeNet® > Descobrir preditores principais.

Quando usar uma análise alternativa

Se você quiser experimentar um modelo de regressão paramétrica com uma variável resposta contínua, use Ajuste do modelo de regressão.

Para comparar o desempenho de um modelo de regressão Random Forests®, use Regressão Random Forests®.

1 Breiman, Friedman, Olshen e Stone. (1984). Classification and Regression Trees. Boca Raton, Florida: Chapman & Hall/CRC.
2 H. Zhang and B.H. Singer. (2010). Recursive Partitioning and Applications. Nova York, Nova York: Springer.