Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
Use Classificação Random Forests® para criar um modelo de predição de alto desempenho para uma resposta categórica com muitas variáveis preditoras contínuas e categóricas. Classificação Random Forests® combina informações de muitas árvores CART® para proporcionar um avanço substancial na tecnologia de mineração de dados.
Classificação Random Forests® oferece insights para uma grande variedade de aplicações, incluindo controle de qualidade de fabricação, descoberta de drogas, detecção de fraudes, pontuação de crédito e predição de rotatividade. Use os resultados para identificar variáveis importantes, identificar grupos nos dados com características desejáveis e predizer os valores de resposta para novas observações. Por exemplo, um pesquisador de mercado pode usar Classificação Random Forests® para identificar clientes que têm taxas de resposta mais altas a iniciativas específicas e predizer essas taxas de resposta.
Classificação CART® é uma boa ferramenta de análise exploratória de dados e oferece um modelo fácil de entender para identificar rapidamente preditores importantes. No entanto, após a exploração inicial com Classificação CART®, considere Classificação TreeNet® ou Classificação Random Forests® como um passo de acompanhamento necessário.
A saída de Classificação Random Forests® inclui gráficos de importância relativa da variável, curvas ROC e gráficos de elevação e ganho. Esses gráficos ajudam a avaliar se as variáveis do modelo predizem as classes de resposta com alta precisão e ajudam a identificar os preditores mais importantes para a exatidão da predição. Essas informações são úteis quando você deseja controlar as configurações que permitem um resultado de produção ótimo.
O método foi desenvolvido por Leo Breiman e Adele Cutler da Universidade da Califórnia, Berkeley.
Para realizar um Classificação Random Forests®, escolha .
Se você quiser experimentar um modelo de regressão paramétrica com uma variável resposta categórica, use Ajustar modelo logístico binário.