O que é regressão stepwise?

Regressão stepwise é uma ferramenta automática usada nos estágios exploratórios da construção de modelos para identificar um subconjunto útil de preditores. O processo adiciona sistematicamente a variável mais significativa ou remove a variável menos significativa durante cada etapa.

Por exemplo, uma empresa de consultoria do mercado de habitação coleta dados sobre as vendas de casas no ano anterior com o objetivo de prever preços de venda futuros. Com mais de 100 variáveis preditoras, encontrar um modelo pode ser uma tarefa demorada. O recurso de regressão stepwise do Minitab identifica automaticamente uma sequência de modelos a serem considerados. Estatísticas como AICc, BIC, R2, R2 ajustado, R2 predito, S e Cp de Mallows pode ajudar na comparação dos modelos. O Minitab exobe os resultados completos do modelo que for melhor, de acordo com o procedimento stepwise usado.

Procedimentos de regressão stepwise usuais

  • A regressão stepwise padrão adiciona e remove preditores conforme necessário para cada etapa. O Minitab para quando todas as variáveis que não estão no modelo têm valores-p que são maiores que o valor de alfa-para-inserir especificado e quando todas as variáveis no modelo têm valores-p que são menores ou iguais ao valor de alfa-para-remover especificado.
  • A seleção do critério de informações forward começa com um modelo vazio e o Minitab adiciona o termo de menor valor-p em cada etapa. O Minitab para quando o modelo usa todos os graus de liberdade ou quando não há outros termos a serem adicionados. Os resultados do modelo apresentados pelo Minitab destinam-se ao modelo com o valor mínimo do critério de informações selecionado para o procedimento. Este critério de informações é AICc ou BIC. O maior modelo no etapa final não tem necessariamente o menor valor do critério.
  • A seleção avançada começa com um modelo vazio e o Minitab adiciona o termo mais significativo para cada etapa. O Minitab para quando todas as variáveis que não estão no modelo têm os valores-p maiores que o valor de alfa-para-inserir especificado.
  • A eliminação regressiva começa com todos os preditores no modelo e o Minitab remove a variável menos significativa para cada etapa. O Minitab para quando todas as variáveis que não estão no modelo têm os valores-p que são menores ou iguais ao valor de alfa-para-remover especificado.

Problemas com a regressão stepwise

  • Quando duas variáveis preditoras são altamente correlacionadas, é possível que apenas uma fique no modelo mesmo se a outra for importante.
  • Como o procedimento ajusta muitos modelos, ele pode selecionar aqueles que ajustam os dados bem apenas por acaso.
  • Pode ser que a regressão stepwise não pare com o modelo que apresenta o melhor valor de um determinado critério para um determinado conjunto de preditores.
  • Procedimentos automáticos não consideram o conhecimento especializado que o analista possa ter sobre os dados. Por isso o modelo selecionado pode não ser o melhor sob um ponto de vista prático.
Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política