Tabela Coeficientes de Ajuste do modelo de regressão

Encontre definições e interpretações para cada estatística na tabela Coeficientes.

Coeficientes

Um coeficiente de regressão descreve o tamanho e a direção da relação entre um preditor e variável de resposta. Os coeficientes são os números pelos quais os valores do termo são multiplicados em uma equação de regressão.

Interpretação

O coeficiente de um termo representa a alteração na resposta média associada uma mudança naquele termo, enquanto os outros termos no modelo são mantidos constantes. O sinal do coeficiente indica a direção da relação entre o termo e a resposta. O tamanho do coeficiente é geralmente uma boa maneira de avaliar a significância prática do efeito que um termo exerce sobre a variável de resposta. No entanto, o tamanho do coeficiente não indica se um termo é estatisticamente significativo porque os cálculos para significância também consideram a variação nos dados de resposta. Para determinar a significância estatística, examine o valor de p para o termo.

A interpretação de cada coeficiente depende se ele é um coeficiente para uma variável contínua ou uma variável categórica, o que é descrito da seguinte maneira:
Variável contínua

O coeficiente do termo representa a alteração na resposta média para a mudança da unidade um da mudança daquele termo. Se o coeficiente for negativo, como o termo aumenta, o valor médio da resposta diminui. Se o coeficiente for positivo, como o termo aumenta, o valor médio da resposta aumenta.

Variável categórica
É listado um coeficiente para cada nível da variável categórica com exceção de um (a menos que você opte por mostrar coeficientes para todos os níveis da subcaixa de diálogo Resultados). O coeficiente para um nível da variável categórica deve ser configurado para zero, de modo que o modelo possa ser ajustado. A interpretação do coeficiente de uma variável categórica depende do esquema de codificação que você escolher para as variáveis categóricas. O esquema de codificação pode ser alterado na subcaixa de diálogo Codificando.
  • Com o esquema de codificação (0, 1), cada coeficiente representa a diferença entre cada média de nível e a média de nível de referência. O coeficiente para o nível de referência não é exibido na tabela Coeficientes.
  • Com o esquema de codificação (−1, 0,+1), cada coeficiente representa a diferença entre cada média de nível e a média global.

Por exemplo, um gerente determina que a pontuação de um funcionário em um teste de habilidades de trabalho pode ser prevista utilizando-se o modelo de regressão, y = 130 + 4.3x1 + 10.1x2. Na equação, x1 são as horas de treinamento in-house (de 0 a 20). A variável x2 é uma variável categórica que é igual a 1 se o funcionário tiver um mentor e 0 se o funcionário não tiver um mentor. A resposta é y e é a pontuação do teste. O coeficiente para a variável contínua de horas de treinamento é de 4,3, o que indica que, para cada hora de treinamento, a pontuação média de teste aumenta em 4,3 pontos. Com o esquema de codificação (0, 1), o coeficiente para a variável categórica de mentoria indica que os funcionários com mentores têm pontuação com média de 10,1 pontos maior do que os funcionários sem mentores.

Coeficientes codificados

O Minitab pode ajustar modelos lineares usando uma variedade de esquemas de codificação para as variáveis contínuas do modelo. Esses esquemas de codificação podem melhorar o processo de estimativa e de interpretação dos resultados. Além disso, as unidades codificadas podem alterar os resultados dos testes estatísticos utilizados para determinar se cada termo é um preditor significativo da resposta. Quando um modelo usa unidades codificadas, a análise produz coeficientes codificados.

Interpretação

O método de codificação que utiliza Minitab afeta tanto a estimativa quando a interpretação dos coeficientes codificados, como a seguir:
Especificar níveis inferior e superior para codificar como -1 e +1
Este método tanto centraliza quanto dimensiona as variáveis. O Minitab usa este método no planejamento de experimentos (DOE). Os coeficientes representam a alteração média na resposta associada aos valores altos e baixos especificados.
Subtrai a média e divide pelo desvio padrão
Este método tanto centraliza quanto dimensiona as variáveis. Cada coeficiente representa a mudança esperada na resposta dada a uma mudança de um desvio padrão na variável.
Subtrair a média
Este método centraliza as variáveis. Cada coeficiente representa a mudança esperada na resposta dada a mudança de uma unidade na variável, utilizando a escala de medição original. Ao subtrair a média, o coeficiente constante está estimando a resposta média, quando todos os preditores estão em seus valores médios.
Dividir pelo desvio padrão
Este método dimensiona as variáveis. Cada coeficiente representa a mudança esperada na resposta dada a uma mudança de um desvio padrão na variável.
Subtrair um valor especificado e dividir por outro
O efeito e a interpretação deste método dependem dos valores que inseridos.

Coeficiente de SE

O erro padrão do coeficiente estima a variabilidade entre a estimativa do coeficiente que seria obtida caso fossem extraídas amostras da mesma população por vezes seguidas. O cálculo pressupõe que o tamanho da amostra e os coeficientes para estimativa permaneceriam os mesmos caso fossem extraídas repetidas amostras.

Interpretação

Use o erro padrão do coeficiente para medir a precisão da estimativa do coeficiente. Quanto menor o erro padrão, mais precisa é a estimativa. Dividir o coeficiente pelo erro padrão calcula um valor t. Se o valor de p associado a esta estatística de t for menor do que o seu nível de significância, você deve concluir que o coeficiente é estatisticamente significativo.

Por exemplo, os técnicos estimam um modelo para a insolação, como parte de um teste de energia solar térmica:

Análise de Regressão: Insolação versus Sul; Norte; Hora do dia

Coeficientes

TermoCoefEP de CoefValor-TValor-PVIF
Constante8093772,140,042 
Sul20,818,652,410,0242,24
Norte-23,717,4-1,360,1862,17
Hora do dia-30,210,8-2,790,0103,86

Neste modelo, o Norte e o Sul medem a posição de um ponto focal em polegadas. Os coeficientes para o Norte e o Sul são semelhantes em magnitude. O erro padrão do coeficiente para o Sul é menor do que o erro padrão do coeficiente para o Norte. Portanto, o modelo é capaz de estimar o coeficiente para Sul com maior precisão.

O erro padrão do coeficiente do Norte é quase tão grande quanto o valor do coeficiente em si. O valor de p resultante é maior do que os níveis comuns do nível de significância, de forma que não é possível concluir que o coeficiente para Norte difere de 0.

Enquanto o coeficiente para Sul está mais perto de 0 do que o coeficiente para o Norte, o erro padrão do coeficiente para o Sul também é menor. O valor de p resultante é menor do que os níveis de significância comuns. Como a estimativa do coeficiente para o Sul é mais precisa, é possível concluir que o coeficiente para Sul difere de 0.

A significância estatística é um critério que você pode usar para reduzir um modelo em regressão múltipla. Para obter mais informações, vá para Redução de modelo.

Intervalo de confiança para coeficiente (IC de 95%)

Estes intervalos de confiança (IC) são amplitudes de valores que apresentam a probabilidade de conter o verdadeiro valor de cada termo no modelo.

Como as amostras são aleatórias, é improvável que duas amostras de uma população produzam intervalos de confiança idênticos. No entanto, se você extrair muitas amostras aleatórias, uma determinada porcentagem dos intervalos de confiança resultantes conterá o parâmetro populacional desconhecido. A porcentagem destes intervalos de confiança que contém o parâmetro é o nível de confiança do intervalo.

O intervalo de confiança é composto pelas duas partes a seguir:
Estimativa de ponto
Este valor único estima um parâmetro populacional usando os seus dados amostrais. O intervalo de confiança é centrado em torno da estimativa pontual.
Margem de erro
A margem de erro define a largura do intervalo de confiança e é determinada pela variabilidade observada na amostra, o tamanho da amostra e o nível de confiança. Para calcular o limite superior do intervalo de confiança, a margem de erro é adicionada à estimativa pontual. Para calcular o limite inferior do intervalo de confiança, a margem de erro é subtraída da estimativa pontual.

Interpretação

Use o intervalo de confiança para avaliar a estimativa do coeficiente de população para cada termo no modelo.

Por exemplo, com um nível de confiança de 95%, é possível ter 95% de certeza de que o intervalo de confiança contém o valor do coeficiente para a população. O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra.

Valor-t

O valor-t mede a razão entre o coeficiente e seu erro padrão.

Interpretação

O Minitab usa o valor-t para calcular o valor-p, usado para testar se o coeficiente é significativamente diferente de 0.

É possível usar um valor-t para determinar se a hipótese nula deve ser rejeitada. No entanto, o valor-p é usado com mais frequência porque o limite para a rejeição da hipótese nula não depende dos graus de liberdade. Para obter mais informações sobre como usar o valor-t, acesse Usando o valor-t para determinar se a hipótese nula deve ser rejeitada.

Valor-p – Coeficiente

O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula.

Interpretação

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que o coeficiente do termo é igual a zero, o que implica a não existência de uma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Se um termo do modelo for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
  • Se um coeficiente de uma variável contínua é significativo, as mudanças no valor da variável estão associadas às mudanças no valor médio da resposta.
  • Se um coeficiente para um nível categórico for significativo, a média para aquele nível é diferente tanto da média global (codificação -1, 0, +1) quanto da média para o nível de referência (codificação 0, 1).
  • Se um coeficiente para uma interação é significativo, a relação entre um fator e a resposta depende dos outros fatores do termo. Neste caso, você não deve interpretar os principais efeitos sem considerar o efeito da interação.
  • Se um coeficiente para um termo polinomial for significativo, é possível concluir que os dados contêm curvatura.

VIF

O fator de inflação de variância (VIF) indica quanta variância de um coeficiente tem sido inflada devido às correlações entre as preditoras no modelo.

Interpretação

Use o VIF para descrever a quantidade de multicolinearidade (que é a correlação entre preditores) existe em uma análise de regressão. A multicolinearidade é problemática porque pode aumentar a variação dos coeficientes de regressão, o que torna difícil avaliar o impacto individual que cada um dos preditores correlacionados tem sobre a resposta.

Use as seguintes orientações para interpretar o VIF:
VIF Status do preditor
VIF = 1 Não correlacionados
1 < VIF < 5 Moderadamente correlacionados
VIF > 5 Altamente correlacionados
Um valor de VIF maior que 5 sugere que o coeficiente de regressão é mal estimado devido à multicolinearidade severa.

Para obter mais informações sobre multicolinearidade e como reduzir os efeitos da multicolinearidade, consulte Multicolinearidade na regressão.