O que é regressão stepwise?

Regressão stepwise é uma ferramenta automática usada nos estágios exploratórios da construção de modelos para identificar um subconjunto útil de preditores. O processo adiciona sistematicamente a variável mais significativa ou remove a variável menos significativa durante cada etapa.

Por exemplo, uma empresa de consultoria do mercado de habitação coleta dados sobre as vendas de casas no ano anterior com o objetivo de prever preços de venda futuros. Com mais de 100 variáveis preditoras, encontrar os modelos mais significativos pode ser uma tarefa demorada. O recurso de regressão stepwise do Minitab fornece automaticamente os modelos mais significativos juntamente com o R2, o R2 ajustado, o R2 predito, o S e a CP de Mallows para proporcionar um bom primeiro passo.

Procedimentos de regressão stepwise usuais

  • A regressão stepwise padrão adiciona e remove preditores conforme necessário para cada etapa. O Minitab para quando todas as variáveis que não estão no modelo têm valores-p que são maiores que o valor de alfa-para-inserir especificado e quando todas as variáveis no modelo têm valores-p que são menores ou iguais ao valor de alfa-para-remover especificado.
  • A seleção avançada começa com um modelo vazio e o Minitab adiciona o termo mais significativo para cada etapa. O Minitab para quando todas as variáveis que não estão no modelo têm os valores-p maiores que o valor de alfa-para-inserir especificado.
  • A eliminação regressiva começa com todos os preditores no modelo e o Minitab remove a variável menos significativa para cada etapa. O Minitab para quando todas as variáveis que não estão no modelo têm os valores-p que são menores ou iguais ao valor de alfa-para-remover especificado.

Problemas com a regressão stepwise

  • Quando duas variáveis preditoras são altamente correlacionadas, é possível que apenas uma fique no modelo mesmo se a outra for importante.
  • Como o procedimento ajusta muitos modelos, ele pode selecionar aqueles que ajustam os dados bem apenas por acaso.
  • A regressão stepwise pode não para necessariamente com o modelo com o valor R2 mais alto possível para um número especificado de preditores.
  • Procedimentos automáticos não consideram o conhecimento especializado que o analista possa ter sobre os dados. Por isso o modelo selecionado pode não ser o melhor sob um ponto de vista prático.
Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política