Com o propósito de identificar um subconjunto útil dos termos, o stepwise remove e adiciona termos ao modelo. Se você escolher um procedimento stepwise, os termos que você especificar na caixa de diálogo Modelo são candidatos para o modelo final. Para obter mais informações, acesse Usando regressão stepwise e regressão de melhores subconjuntos.
Com a validação cruzada, o procedimento repete a seleção forward em cada dobra. O procedimento avalia todas as dobras a cada passo e identifica o passo com o melhor valor de R2 stepwise de k dobras. A última parte do procedimento é realizar a seleção forward no conjunto de dados completo, parando no melhor passo das seleções nas dobras.
Para ambos os tipos de validação, o procedimento para nas mesmas condições do procedimento de critérios de informações forward.
Os termos incluídos no modelo final podem depender de restrições de hierarquia dos modelos. Para obter mais informações, consulte o tópico sobre Hierarquia apresentado abaixo.
Especifique quais critérios de informações devem ser usados na seleção progressiva
Tanto AICc como BIC avaliam a verossimilhança do modelo e aplicam uma penalidade para adicionar termos ao modelo. Tal penalidade reduz a tendência de sobreajuste do modelo aos dados amostrais. Essa redução pode produzir um modelo com melhor desempenho geral.
Como orientação geral, quando o número de parâmetros é pequeno em relação ao tamanho amostral, o BIC tem uma penalidade maior do que o AICc para a adição de cada parâmetro. Nesses casos, o modelo que minimiza o BIC tende a ser menor do que o modelo que minimiza o AICc.
Em alguns casos comuns, tais como filtragens de experimento, o número de parâmetros geralmente é grande em relação ao tamanho amostral. Nesses casos, o modelo que minimiza o AICc tende a ser menor do que o modelo que minimiza o BIC. Por exemplo, para uma filtragem de experimento definitiva de 13 ensaios, o modelo que minimiza o AICc tenderá a ser menor que o modelo que minimiza o BIC no conjunto de modelos com 6 ou mais parâmetros.
Para obter mais informações sobre AICc e BIC, consulte Burnham e Anderson.1
As configurações de validação também estão na subcaixa de diálogo Validação. Se você alterar as configurações, o Minitab atualiza automaticamente as configurações em ambos os lugares.
Quando você selecionar Seleção forward com validação, escolha o método de validação para testar seu modelo. Normalmente, com amostras menores, o método de validação cruzada de K dobras é apropriado. Com amostras maiores, você pode dividir os dados em um conjunto de dados de treinamento e um conjunto de dados de teste.
Complete as seguintes etapas para usar a validação cruzada de K dobras.
Conclua as etapas a seguir para dividir os dados em um conjunto de dados de treinamento e um conjunto de dados de teste.
Você pode determinar como o Minitab impõe a hierarquia do modelo durante um procedimento stepwise. O botão Hierarquia é desativado se você especificar um modelo não-hierárquico na caixa de diálogo Modelo.
Em um modelo hierárquico, todos os termos de ordem inferior que incluem os termos de ordem superior também aparecem no modelo. Por exemplo, um modelo que inclui o termo de interação A*B*C é hierárquico se incluir estes termos: A, B, C, A*B, A*C e B*C.
Os modelos podem ser não-hierárquicos. Geralmente, você pode remover termos de ordem inferior se eles forem insignificantes, exceto se o conhecimento da área do assunto sugerir que você os inclua. Os modelos que contêm muitos termos podem ser relativamente imprecisos e podem reduzir a capacidade de predizer os valores de novas observações.
Quando você escolher Seleção forward com validação, exiba um gráfico dos valores de treinamento e validação R2 para cada etapa na seleção forward. Normalmente, você usa o gráfico para determinar se modelos mais simples têm valores de validação semelhantes.