Considerações de dados para Regressão CART®

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes quando coletar dados, realizar a análise e interpretar seus resultados.

A variável resposta (alvo) deve ser categórica
Uma variável contínua pode ser medida e ordenada, e tem um número infinito de valores entre quaisquer dois valores. Por exemplo, os diâmetros de uma amostra de pneus é uma variável contínua.

Os dados da variável resposta devem ser valores numéricos.

Se sua variável resposta for categórica, use Classificação CART®.

As variáveis preditoras podem ser contínuas ou categóricas
Você pode usar uma combinação de preditores contínuos ou categóricos; no entanto, os comprimentos da coluna para cada preditor devem ser iguais aos da coluna de resposta. Não são permitidos valores faltantes.
  • Todos os preditores contínuos devem ser numéricos.
  • Os preditores categóricos podem se valores de texto ou numéricos.
É recomendável usar um conjunto de testes quando o número de casos for maior que 5000

Por padrão, o Minitab usa validação cruzada quando o número de casos é menor ou igual a 5000. Quando o número de casos é maior que 5000, o Minitab usa um conjunto de testes. A validação com um conjunto de dados de treinamento e um conjunto de dados de teste é útil quando o conjunto de dados é grande. Para obter mais informações sobre as configurações para técnicas de validação em Regressão CART®, acesse Especifique o método de validação para Regressão CART®.