Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
A análise cria tantas funções de base quanto você especificar, com uma pequena modificação no modelo a partir das informações em cada função. Se a análise incluir um método de validação, a análise calculará o valor do critério de seleção do modelo para os dados de treinamento e os dados de teste para cada número de funções de base. O valor ideal dos dados de teste determina o número de funções no modelo ideal.
Critérios de otimização do modelo, como R2 máximo, tendem a ser otimistas quando você os calcula com os mesmos dados usados para ajustar um modelo. Os métodos de validação do modelo deixam uma parte dos dados fora do processo de ajuste do modelo e calculam a estatística que avalia o desempenho do modelo nos dados omitidos. As técnicas de validação do modelo fornecem uma estimativa melhor de como os modelos se comportam em novos dados. Dependendo da sua seleção da função de perda para a análise, o critério será o máximo R2 ou o menor Desvio absoluto médio (DAM). O Minitab oferece dois métodos de validação: validação cruzada de K duplicações e validação com um conjunto de teste separado.
A validação cruzada de K dobras é o método padrão no Minitab quando os dados têm 2000 casos ou menos. Como o processo se repete K vezes, a validação cruzada geralmente é mais lenta do que a validação com dados de teste.
Na validação com um conjunto de teste, uma parte dos dados é reservada para validação. Os demais dados são do conjunto de treinamento. Primeiro, o Minitab adiciona funções de base com o conjunto de treinamento. Em seguida, o Minitab calcula os valores do critério de seleção de modelo para cada número de funções usando o conjunto de testes. O número de funções com o melhor valor faz o modelo ideal.
Sem qualquer validação, o Minitab usa todo o conjunto de dados para ajustar o modelo. O modelo final geralmente contém o maior número de funções de base.