Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
Os modelos do TreeNet® representam uma abordagem para resolver problemas de classificação e regressão que são mais precisos e resistentes ao sobreajuste do que uma única classificação ou árvore de regressão. Uma descrição ampla e geral do processo é o que começamos com uma árvore de regressão pequena como modelo inicial. Dessa árvore vêm resíduos para cada linha nos dados que se tornam a variável de resposta para a próxima árvore de regressão. Criamos outra pequena árvore de regressão para predizer os resíduos da primeira árvore e calcular os resíduos resultantes novamente. Repetimos esta sequência até que um número ótimo de árvores com erro mínimo de predição seja identificado usando um método de validação. A sequência resultante de árvores forma o Modelo de Classificação TreeNet®.
Para o caso de classificação, podemos adicionar mais alguns detalhes matemáticos para uma análise com uma resposta binária e para uma análise com uma resposta multinomial.
Em que é o número de eventos e É o número de não eventos.
Entrada | Símbolo |
---|---|
taxa de aprendizado | |
taxa amostral | |
número máximo de nós terminais por árvore | |
número de árvores |
e é um vetor que representa a i-ésima linha dos valores preditores nos dados de treinamento.
Termo | Descrição |
---|---|
número de eventos no nó terminal m na árvore j | |
número de casos no nó terminal m na árvore j | |
média aritmética de para todos os casos no nó terminal m na árvore j |
em que é o número de casos em que o valor de resposta é k e N é o número de linhas nos dados de treinamento.
Entrada | Símbolo |
---|---|
taxa de aprendizado | |
taxa amostral | |
número máximo de nós terminais por árvore | |
número de árvores |
O cálculo das probabilidades dos ajustes explica a natureza dependente dessas árvores. Caso contrário, o processo é substancialmente igual ao do caso binário.
em que
e é um vetor que representa a i-ésima linha dos valores preditores no conjunto de dados de treinamento.
em que
Termo | Descrição |
---|---|
número de casos para o resultado k no nó terminal m na árvore j | |
número de casos no nó terminal m na árvore j | |
média aritmética de para todos os casos no nó terminal m na árvore j. |