Especifique o método de validação para Classificação Random Forests®

Módulo de análise preditiva > Classificação do Random Forests® > Validação
Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Selecione se deve fazer a validação com um conjunto de dados de teste, além da validação com dados usando método out-of-bag.

Validação com dados out-of-bag

Classificação Random Forests® usa amostragem de bootstrap para cada árvore. Cada registro em uma amostra de bootstrap é selecionado aleatoriamente com a substituição do conjunto de dados original. Das observações totais do conjunto de dados original, alguns registros serão deixados de fora de cada amostra de bootstrap. As linhas deixadas de fora de uma amostra por bootstrap criam um conjunto de dados out-of-bag.

Validação com um conjunto de teste além de dados out-of-bag

Conclua os passos a seguir para especificar uma fração dos dados a serem usados para treinamento e teste. Se você selecionar Validação com um conjunto de teste além de dados out-of-bag, por padrão, o Minitab usa 30% dos dados para testes.

  1. Na lista suspensa, selecione Validação com um conjunto de teste além de dados out-of-bag.
  2. Selecione uma das opções a seguir para determinar se selecionará uma fração de linhas aleatoriamente ou com uma coluna de ID.
    • Selecionar aleatoriamente uma fração de linhas como um conjunto de teste: Selecione esta opção para fazer com que o Minitab selecione aleatoriamente uma fração de linhas para testes. Você pode especificar a fração. O valor padrão de 0,3 funciona bem na maioria dos casos. Para conjuntos de dados maiores, é recomendável aumentar a fração de dados usados para testes. Também é possível definir uma base para o gerador de números aleatórios.
    • Definir a divisão de treinamento/teste por coluna IDs: Selecione esta opção para escolher as linhas a serem incluídas na amostra de teste. Em Coluna de IDs, digite a coluna que indica quais linhas devem ser usadas para a amostra de teste. A coluna ID deve conter apenas 2 valores. Em Nível para conjunto de teste, selecione qual nível deve ser usado como amostra de teste.
  3. (Opcional) Verifique Armazenar a coluna de IDs para a divisão de treinamento/teste para salvar a coluna ID.