Gráfico de linha ajustada para Gráfico de linha ajustada

Encontre definições e interpretações para o gráfico de linha ajustada.

Gráfico de linha ajustada

O gráfico de linha ajustada exibe os dados de resposta e da preditora. O gráfico inclui a linha de regressão, que representa a equação de regressão. Você também pode escolher exibir os intervalos de confiança de 95% e de predição no gráfico.

Interpretação

Avalie como o modelo ajusta seus dados e se o modelo satisfaz os seus objetivos. Examine o gráfico de linha ajustada para determinar se são atendidos os seguintes critérios:
  • A amostra contém um número adequado de observações ao longo de toda a faixa de todos os valores de predição.
  • O modelo ajusta adequadamente qualquer curvatura aos dados. Se você ajustar um modelo linear e observar curvatura nos dados, repita a análise e selecione o modelo quadrático ou cúbico. Para determinar qual modelo é melhor, examine o gráfico e as estatísticas de qualidade do ajuste. Verifique o valor de p para os termos do modelo para garantir de que eles sejam estatisticamente significativos, e aplique o conhecimento do processo para avaliar a significância prática.
  • Procure por todos os outliers, os quais podem exercer forte efeito sobre os resultados. Tente identificar a causa de todos os outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise. Para obter mais informações sobre detecção de outliers, vá para Observações atípicas.

Equação de regressão

Use a equação de regressão, para descrever a relação entre a resposta e os termos no modelo. A equação de regressão é uma representação algébrica da linha de regressão. A equação de regressão para o modelo linear assume a seguinte forma: Y= b0 + b1x1. Na equação de regressão, Y é a variável de resposta, b0 é a constante ou intercepto, b1 é o valor do coeficiente do termo linear (também conhecido como inclinação da linha), e x1 é o valor do termo.

A equação de regressão com mais de um termo assume a seguinte forma:

y = b0 + b1X1 + b2X2 + ... + bkXk

Na equação de regressão, as letras representam o seguinte:
  • y é a variável de resposta
  • b0 é a constante
  • b1, b2, ..., bk são os coeficientes
  • X1, X2, ..., Xk são os valores do termo

Coeficientes de equação

Um coeficiente de regressão descreve o tamanho e a direção da relação entre um preditor e variável de resposta. Os coeficientes são os números pelos quais os valores do termo são multiplicados em uma equação de regressão.

Interpretação

O coeficiente do termo representa a alteração na resposta média para a mudança da unidade um daquele termo. O sinal do coeficiente indica a direção da relação entre o termo e a resposta. Se o coeficiente for negativo, como o termo aumenta, o valor médio da resposta diminui. Se o coeficiente for positivo, como o termo aumenta, o valor médio da resposta aumenta.

Por exemplo, um gerente determina que a pontuação de um funcionário em um teste de habilidades de trabalho pode ser prevista utilizando-se o modelo de regressão, y = 130 + 4,3x. Na equação, x são as horas de treinamento in-house (de 0 a 20) e y é o resultado do teste. O coeficiente, ou inclinação, é de 4,3, o que indica que, para cada hora de treinamento, a pontuação média de teste aumenta em 4,3 pontos.

O tamanho do coeficiente é geralmente uma boa maneira de avaliar a significância prática do efeito que um termo exerce sobre a variável de resposta. No entanto, o tamanho do coeficiente não indica se um termo é estatisticamente significativo porque os cálculos para significância também consideram a variação nos dados de resposta. Para determinar a significância estatística, examine o valor de p para o termo.

IC de 95%

O intervalo de confiança do ajuste fornece um intervalo de valores prováveis para a resposta média dadas as configurações especificadas das preditoras.

Interpretação

Use o intervalo de confiança para avaliar a estimativa do valor ajustado para os valores observados das variáveis.

Por exemplo, com um nível de confiança de 95%, você pode ter 95% de confiança de que o intervalo de confiança contém a média da população para os valores especificados das variáveis no modelo. O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Um amplo intervalo de confiança indica que você pode estar menos confiante sobre a média de valores futuros. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra.

IP de 95%

O intervalo de predição é um intervalo que provavelmente contém uma única resposta futura para um valor de variável da preditora.

Interpretação

Com faixas de predição de 95%, você pode ter 95% de confiança de que as novas observações irão cair dentro do intervalo indicado pelas linhas roxas. (Observe, contudo, que isto só é verdadeiro para valores de densidade que estão dentro do intervalo incluído na análise.)

Por exemplo, um engenheiro de materiais em uma fábrica de móveis desenvolve um modelo de regressão simples para predizer a rigidez de uma placa de aglomerado a partir da densidade da placa. O engenheiro verifica se o modelo atende às suposições da análise. Depois, o analista usa o modelo para predizer a rigidez.

A equação de regressão prediz que a rigidez de uma nova observação com uma densidade de 20 é de 12,70 – 1,517*20 + 0,1622*202 ou 47,24. Apesar de ser improvável que essa observação tenha uma rigidez de exatamente 47,24, o intervalo de predição indica que o engenheiro pode ter 95% de confiança de que o valor real estará, aproximadamente, entre 31 e 63.

O intervalo de predição é sempre mais amplo que o intervalo de confiança correspondente. Neste exemplo, o intervalo de confiança de 95% indica que o engenheiro pode ter 95% de confiança de que a rigidez média estará entre, aproximadamente, 43 e 50.