O que é regressão ponderada?

A regressão ponderada é um método que pode ser usado quando a suposição de mínimos quadrados da variância da constante nos resíduos é violada (também chamada de heteroscedasticidade). Com o peso correto, este procedimento minimiza a soma dos resíduos quadrados ponderados para produzir resíduos padronizados com uma variância de constante (homoscedasticidade).

Importante

A regressão ponderada não é uma solução apropriada quando a heteroscedasticidade é causada por uma variável omitida.

Como escolher o peso a ser usado

Determinar o peso correto a ser usado pode ser uma tarefa desafiadora. O peso ideal é a recíproca da variância do erro. Entretanto, isso geralmente não pode ser calculado, e é necessário usar outras abordagens. As abordagens alternativas incluem:
  • O recíproco de um preditor ou preditor ao quadrado se a variância é proporcional a um preditor. Use a experiência combinada com a tentativa e erro para determinar o que funciona.
  • Valores baseados em teoria, literatura ou pesquisa anterior.

Normalmente observações com pequenas variâncias devem ter pesos relativamente grandes e observações com grandes variâncias devem ter pesos relativamente pequenos.

Suponha que seu modelo de regressão prediz o número anual de acidentes de trânsito em diferentes cidades. Como as cidades mais populosas tendem a ter mais acidentes, os resíduos para cidades maiores também tendem a ser maiores. Uma abordagem para resolver isso é usar o recíproco da população de cada cidade para o peso.

Pesos não afetam os graus de liberdade

Especificando uma coluna de pesos não afeta os graus de liberdade, a menos que você especifique um peso de zero para uma ou mais observações. Dar a uma observação um peso de zero, elimina-a da análise e, portanto, diminui os seus graus de liberdade.

Especificar uma coluna de pesos afeta as somas dos quadrados e as estimativas de parâmetros da seguinte maneira:
  • As somas de quadrados se tornam as somas ponderadas dos quadrados.
  • A média ponderada é usada na soma total dos quadrados.
  • Um critério de mínimos quadrados ponderados é utilizado para estimar os parâmetros.

Crie um gráfico de linha ajustada para regressão linear ponderada

O gráfico criado com as etapas a seguir não contém a equação de regressão, s, R quadrado e R quadrado ajustado (aj) como o Gráfico de Linha Ajustada criada com Estat > Regressão > Gráfico de linha ajustada. No entanto, o Minitab imprime essas informações na saída e você pode copiá-las e colá-las no gráfico.

Suponha que as respostas estão em C1, os preditores em C2 e os pesos em C3:

  1. Selecione Estat > Regressão > Regressão > Ajuste do modelo de regressão
  2. Em Respostas, insira C1. Em Preditores contínuos, insira C2.
  3. Clique em Opções.
  4. Em Pesos, insira C3. Clique em OK.
  5. Clique em Armazenamento.
  6. Marque Ajustes.
  7. Clique em OK em cada caixa de diálogo.
  8. Selecione Gráfico > Gráfico de dispersão.
  9. Clique em Simples. Clique em OK.
  10. Em Variáveis Y, insira C1.
  11. Em Variáveis X, insira C2. Clique em OK.
  12. Clique com o botão direito do mouse no gráfico de dispersão e escolha Adicionar > Linha Calculada.
  13. Em Coluna Y, digite a coluna de ajustes (normalmente chamada FITS1).
  14. Em Coluna X, insira C2. Clique em OK.

Editar a cor da linha e o título do gráfico

É possível mudar a cor da linha. Para tornar a linha azul, clique duas vezes nela. Na guia Atributos, sob Linhas, selecione Personalizado, e selecione azul na lista suspensa Cores. Clique em OK.

Também é possível mudar o título. Clique duas vezes no título. Na guia Fonte, sob Texto, digite o título que desejar. Clique em OK.