Especifique o método de validação para Descobrir o melhor modelo (Resposta contínua)

Módulo de análise preditiva > Aprendizado de máquina automatizado > Descobrir o melhor modelo (Resposta contínua) > Validação
Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Escolha o método de validação para determinar o melhor tipo de modelo. Normalmente, com amostras menores, o método de validação cruzada de K dobras é apropriado. Com amostras maiores, você pode selecionar uma fração de casos para usar no treinamento e nos testes.

As seleções que o Minitab apresenta dependem do tamanho do conjunto de dados. As seleções combinam-se com seleções no Termos subdialog para fornecer uma análise que equilibre rigor e velocidade de cálculo:
N < 1,500
O método de validação no Validação subdilog é Validação cruzada de K dobras. O número de unidades é 5. O Método de seleção do modelo de regressãoTermos subdialog Stepwiseé.
1,500 ≤ N < 2,000
O método de validação no Validação subdilog é Validação cruzada de K dobras. O número de unidades é 5. O Método de seleção do modelo de regressãoTermos subdialog Seleção forward com validaçãoé.
2,000 ≤ N
O método de validação no Validação subdilog é Validação com um conjunto de testes. A proporção de dados no conjunto de testes é de 0,3. O Método de seleção do modelo de regressãoTermos subdialog Seleção forward com validaçãoé.

Validação cruzada de K dobras

Conclua os passos a seguir para usar o método de validação cruzada de K dobras para validar a amostra de teste.

  1. Na lista suspensa, selecione Validação cruzada de K dobras.
  2. Especifique o número de réplicas O valor padrão de 5 funciona bem na maioria dos casos. Um número maior de dobras em ambos os casos aumenta a chance de selecionar um modelo preditivo mais confiável, especialmente para conjuntos de dados com menos linhas, mas pode aumentar significativamente o tempo de cálculo. Um número maior pode aumentar significativamente o tempo de cálculo.
  3. (Opcional) Selecione Armazenar a coluna de IDs para a validação cruzada de K dobras para salvar a coluna ID.

Validação com um conjunto de testes

Conclua os passos a seguir para especificar uma fração dos dados a serem usados para treinamento e teste. Em muitos casos, 70% dos dados são utilizados para treinamento, e 30% dos dados são usados para testes.

  1. Na lista suspensa, selecione Validação com um conjunto de testes.
  2. Especifique a fração dos dados para o conjunto de testes. O valor padrão de 0,3 funciona bem na maioria dos casos. Para conjuntos de dados maiores, é recomendável aumentar a fração de dados usados para testes. Também é possível definir uma base para o gerador de números aleatórios. Quando você entra na mesma base em diferentes corridas da análise, a atribuição de linhas para o conjunto de testes é a mesma.
  3. (Opcional) Selecione Armazenar a coluna de IDs para a divisão de treinamento/teste para salvar a coluna ID.