Especifique o método de validação para Descobrir o melhor modelo (Resposta binária)

Módulo de análise preditiva > Aprendizado de máquina automatizado > Descobrir o melhor modelo (Resposta binária) > Validação
Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Escolha o método de validação para determinar o melhor tipo de modelo. Normalmente, com amostras menores, o método de validação cruzada de K dobras é apropriado. Com amostras maiores, você pode selecionar uma fração de casos para usar no treinamento e nos testes.

As seleções que o Minitab apresenta dependem do tamanho do conjunto de dados. As seleções combinam-se com seleções no Termos subdialog para fornecer uma análise que equilibre rigor e velocidade de cálculo:
N(1.000)
O método de validação no Validação subdilog é Validação cruzada de K dobras. O número de unidades é 5. O Método de seleção do modelo de regressão logísticaTermos subdialog Stepwiseé.
1.000 + 0,2 = 1.500
O método de validação no Validação subdilog é Validação cruzada de K dobras. O número de unidades é 3. O Método de seleção do modelo de regressão logísticaTermos subdialog Stepwiseé.
1.500, ..., ni
O método de validação no Validação subdilog é Validação com um conjunto de testes. A proporção de dados no conjunto de testes é de 0,3. O Método de seleção do modelo de regressão logísticaTermos subdiálogo é Seleção forward com validação, que usa o conjunto de teste.

Validação cruzada de K dobras

Conclua os passos a seguir para usar o método de validação cruzada de K dobras para validar a amostra de teste.

  1. Na lista suspensa, selecione Validação cruzada de K dobras.
  2. Especifique o número de réplicas O valor padrão de 0,3 funciona bem na maioria dos casos. Um número maior de duplicatas em ambos os casos aumenta a chance de selecionar um modelo preditivo mais confiável, especialmente para conjuntos de dados com menos linhas, mas pode aumentar significativamente o tempo de cálculo. Um número maior pode aumentar significativamente o tempo de cálculo.
  3. (Opcional) Selecione Armazenar a coluna de IDs para a validação cruzada de K dobras para salvar a coluna ID.

Validação com um conjunto de testes

Conclua os passos a seguir para especificar uma fração dos dados a serem usados para treinamento e teste. Em muitos casos, 70% dos dados são utilizados para treinamento, e 30% dos dados são usados para testes.

  1. Na lista suspensa, selecione Validação com um conjunto de testes.
  2. Especifique a fração dos dados para o conjunto de testes. O valor padrão de 0,3 funciona bem na maioria dos casos. Para conjuntos de dados maiores, é recomendável aumentar a fração de dados usados para testes. Também é possível definir uma base para o gerador de números aleatórios. Quando você entra na mesma base em diferentes corridas da análise, a atribuição de linhas para o conjunto de testes é a mesma.
  3. (Opcional) Selecione Armazenar a coluna de IDs para a divisão de treinamento/teste para salvar a coluna ID.