Comparação entre regressão de melhores subconjuntos e regressão stepwise

A regressão de melhores subconjuntos fornece informações sobre o ajuste de vários modelos diferentes, permitindo selecionar um modelo com base em quatro estatísticas diferentes. A regressão stepwise gera um único modelo baseado em uma única estatística. Como diferentes critérios de seleção são usados em cada modelo, é possível que a regressão de melhores subconjuntos e a regressão stepwise gerem modelos diferentes. Orientações gerais para o método a ser usado são apresentadas abaixo:
  • Para conjuntos de dados com um número pequeno de preditores, a regressão de melhores subconjuntos é melhor que a regressão stepwise porque fornece informações sobre mais modelos.
  • Os melhores subconjuntos apenas permitem a você ter 31 preditoras livres, portanto, para conjuntos de dados com um grande número de preditoras, a regressão stepwise é melhor do que a regressão de melhores subconjuntos. Ao usar a regressão stepwise em um conjunto de dados com um grande número de preditoras, escolha grandes níveis alfa para inserir e alfa para remover (0,25 a 0,50). Isso permite aprender mais sobre os efeitos de cada preditora inserida na resposta e nas preditoras que já estão no modelo.

Verificando o modelo

Tenha cuidado ao usar procedimentos de seleção de variáveis como melhores subconjuntos e regressão stepwise. Esses procedimentos são automáticos e, portanto, não consideram a importância prática de quaisquer das preditoras. Além disso, quando você ajusta um modelo aos dados, a qualidade do ajuste vem de duas fontes básicas:
  • A estrutura subjacente dos dados (uma estrutura que se aplica a outros conjuntos de dados coletados da mesma maneira)
  • As peculiaridades do conjunto de dados específico analisado

Para assegurar que seu modelo não apenas se ajusta a um conjunto de dados específico, você deve verificar o modelo encontrado pelo procedimento de seleção em um novo conjunto de dados. Você também pode usar o conjunto de dados original, dividi-lo aleatoriamente em duas partes, usar os melhores subconjuntos em uma parte para selecionar um modelo e, depois, verificar o ajuste na segunda parte. Isso ajudará a garantir que o modelo selecionado se aplicará a outros conjuntos de dados coletados da mesma maneira.

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política