Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
Os modelos do TreeNet® representam uma abordagem para resolver problemas de classificação e regressão que são mais precisos e resistentes ao sobreajuste do que uma única classificação ou árvore de regressão. Uma descrição ampla e geral do processo é o que começamos com uma árvore de regressão pequena como modelo inicial. Dessa árvore vêm resíduos para cada linha nos dados que se tornam a variável de resposta para a próxima árvore de regressão. Criamos outra pequena árvore de regressão para predizer os resíduos da primeira árvore e calcular os resíduos resultantes novamente. Repetimos esta sequência até que um número ótimo de árvores com erro mínimo de predição seja identificado usando um método de validação. A sequência resultante de árvores forma o Modelo de Classificação TreeNet®.
Para o caso de classificação, podemos adicionar mais alguns detalhes matemáticos para uma análise com uma resposta binária e para uma análise com uma resposta multinomial.
, assume os seguintes valores: {-1, 1}.
Em que
é o número de eventos e
É o número de não eventos.
| Entrada | Símbolo |
|---|---|
| taxa de aprendizado | ![]() |
| taxa amostral | ![]() |
| número máximo de nós terminais por árvore | ![]() |
| número de árvores | ![]() |
:


e
é um vetor que representa a i-ésima linha dos valores preditores nos dados de treinamento.

| Termo | Descrição |
|---|---|
![]() | número de eventos no nó terminal m na árvore j |
![]() | número de casos no nó terminal m na árvore j |
![]() | média aritmética de para todos os casos no nó terminal m na árvore j |


em que
é o número de casos em que o valor de resposta é k e N é o número de linhas nos dados de treinamento.
| Entrada | Símbolo |
|---|---|
| taxa de aprendizado | ![]() |
| taxa amostral | ![]() |
| número máximo de nós terminais por árvore | ![]() |
| número de árvores | ![]() |
O cálculo das probabilidades dos ajustes explica a natureza dependente dessas árvores. Caso contrário, o processo é substancialmente igual ao do caso binário.
,
, o número de árvores na análise, e
, o número de níveis da variável resposta:

em que

e
é um vetor que representa a i-ésima linha dos valores preditores no conjunto de dados de treinamento.

é o ajuste para a i-ésima linha na árvore j–1 para o k-ésimo nível da variável resposta.
em que
| Termo | Descrição |
|---|---|
![]() | número de casos para o resultado k no nó terminal m na árvore j |
![]() | número de casos no nó terminal m na árvore j |
![]() | média aritmética de para todos os casos no nó terminal m na árvore j. |
