Especifique o método de validação para CART® regressão

Estat > Análise Preditiva > CART® Regressão > Validation

Escolha o método de validação para testar seu modelo. Normalmente, com amostras menores, o método de validação cruzada de K duplicações é apropriado. Com amostras maiores, você pode selecionar uma fração de casos para usar no treinamento e nos testes.

Validação cruzada de K duplicações

Conclua os passos a seguir para se quiser usar o método de validação cruzada de K duplicações para validar a amostra de teste. O método de validação cruzada de K duplicações é o método padrão quando o número de linhas é ≤ 5000.

  1. Na lista suspensa, selecione Validação cruzada de K duplicações.
  2. Escolha um dos seguintes para especificar se atribuir duplicações aleatoriamente ou com uma coluna de ID:
    • Atriubuir aleatoriamente linhas de cada duplicação: Selecione esta opção para fazer com que o Minitab selecione aleatoriamente as linhas para cada duplicação. Você pode especificar o número de duplicações. O valor padrão de 10 funciona bem na maioria dos casos. Usar um valor menor de K pode introduzir um viés ainda maior; contudo, valores maiores de K podem introduzir mais variabilidade. Também é possível definir uma base para o gerador de números aleatórios.
    • Atribuir as linhas de cada dupliçãcao pela coluna de IDs: Selecione esta opção para escolher as linhas a serem incluídas em cada duplicação. Em Coluna de IDs, digite a coluna que contém as linhas para cada duplicação.
  3. (Opcional) Verifique Armazenar a coluna de IDs para a validação cruzada de K duplicações para salvar a coluna ID.

Validação com um conjunto de teste

Conclua os passos a seguir se quiser especificar uma fração dos dados a serem usados para treinamento e teste. O método de validação do conjunto de teste é o método padrão quando o número de linhas é de > 5000. Em muitos casos, 70% dos dados são utilizados para treinamento, e 30% dos dados são usados para testes.

  1. Na lista suspensa, selecione Validação com um conjunto de teste.
  2. Selecione uma das opções a seguir para determinar se selecionará uma fração de linhas aleatoriamente ou com uma coluna de ID.
    • Selecione aleatoriamente uma fração de linhas como um conjunto de teste: Selecione esta opção para fazer com que o Minitab selecione aleatoriamente uma fração de linhas para testes. Você pode especificar a fração. O valor padrão de 0,3 funciona bem na maioria dos casos. Para conjuntos de dados maiores, é recomendável aumentar a fração de dados usados para testes. Também é possível definir uma base para o gerador de números aleatórios.
    • Definir divisão para treinamento/teste pela coluna de IDs: Selecione esta opção para escolher as linhas a serem incluídas na amostra de teste. Em Coluna de IDs, digite a coluna que indica quais linhas devem ser usadas para a amostra de teste. A coluna ID deve conter apenas dois valores. Em Nível para el conjunto de teste, selecione qual nível deve ser usado como amostra de teste.
  3. (Opcional) Verifique Armazenar a coluna de IDs para a divisão de treinamento/teste para salvar a coluna ID.

Nenhum

Se Nenhum for selecionado, nenhuma validação adicional é realizada.
Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política