Considerações de dados para Classificação Random Forests®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes quando coletar dados, realizar a análise e interpretar seus resultados.

A variável resposta deve ser categórica
As variáveis categóricas contêm um número finito e contável de categorias ou grupos distintos. Os dados categóricos podem ou não ter uma ordem lógica. Por exemplo, as variáveis categóricas incluem gênero, tipo material e método de pagamento.
  • Se sua variável resposta tiver duas categorias, como passar e falhar, então a resposta é binária.
  • Se sua variável resposta contém três ou mais categorias, então a resposta é multinomial.

Os dados da variável resposta devem ser valores de texto ou valores numéricos. Não são permitidos valores de data/hora.

Se sua variável resposta for contínua, use Regressão Random Forests®.

As variáveis preditoras podem ser contínuas ou categóricas
Você pode usar uma combinação de preditores contínuos ou categóricos; no entanto, os comprimentos da coluna para cada preditor devem ser iguais aos da coluna de resposta. Não são permitidos valores faltantes.
  • Todos os preditores contínuos devem ser numéricos.
  • Os preditores categóricos podem se valores de texto ou numéricos.