Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável resposta e o termo. Se você ajustar um modelo quadrático ou um modelo cúbico e os termos quadráticos ou cúbicos não forem estatisticamente significativos, talvez você deseje escolher um modelo diferente.
Fonte | GL | SQ | QM | F | P |
---|---|---|---|---|---|
Regressão | 2 | 12189,4 | 6094,70 | 106,54 | 0,000 |
Erro | 26 | 1487,3 | 57,21 | ||
Total | 28 | 13676,7 |
Fonte | GL | SQ | F | P |
---|---|---|---|---|
Linear | 1 | 11552,8 | 146,86 | 0,000 |
Quadrático | 1 | 636,6 | 11,13 | 0,003 |
Nestes resultados, o valor-p para o termo linear, Densidade é 0,000 e para o termo quadrático, Densidade2 é de 0,003. Ambos os valores são menores do que o nível de significância de 0,05. Esses resultados indicam que a associação entre dureza e a densidade é estatisticamente significativa.
Se o valor-p do termo for significativo, você pode examinar a equação de regressão e os coeficientes para compreender como o termo está relacionado à resposta.
Use a equação de regressão, para descrever a relação entre a resposta e os termos no modelo. A equação de regressão é uma representação algébrica da linha de regressão. A equação de regressão para o modelo linear assume a seguinte forma: Y= b0 + b1x1. Na equação de regressão, Y é a variável resposta, b0 é a constante ou intercepto, b1 é o valor do coeficiente do termo linear (também conhecido como inclinação da linha), e x1 é o valor do termo.
O coeficiente do termo representa a alteração na resposta média para a mudança da unidade um daquele termo. O sinal do coeficiente indica a direção da relação entre o termo e a resposta. Se o coeficiente for negativo, como o termo aumenta, o valor médio da resposta diminui. Se o coeficiente for positivo, como o termo aumenta, o valor médio da resposta aumenta.
Por exemplo, um gerente determina que a pontuação de um funcionário em um teste de habilidades de trabalho pode ser prevista utilizando-se o modelo de regressão, y = 130 + 4,3x. Na equação, x são as horas de treinamento in-house (de 0 a 20) e y é o resultado do teste. O coeficiente, ou inclinação, é de 4,3, o que indica que, para cada hora de treinamento, a pontuação média de teste aumenta em 4,3 pontos.
Para obter mais informações sobre coeficientes, vá para Coeficientes de regressão.
S | R2 | R2(aj) |
---|---|---|
7,56342 | 89,13% | 88,29% |
O coeficiente para o preditor, Densidade, é de –1,517 e, para a Densidade2, o coeficiente é de 0,1622. Assim, com uma relação quadrática, a rigidez média do aglomerado aumenta mais rapidamente com valores de densidade maiores do que com valores de densidade menores.
Para determinar se o modelo ajusta bem os dados, examine as estatísticas de qualidade do ajuste tabela do resumo do modelo.
R2 é o percentual de variação na resposta que é explicada pelo modelo.Quanto maior o valor R2, melhor o modelo ajusta seus dados.R2 está sempre entre 0% e 100%.
R2 sempre aumenta quando você adiciona mais preditores a um modelo. Por exemplo, o melhor modelo de cinco preditores terá sempre um R2 que seja pelo menos tão elevado quanto o melhor modelo de quatro preditores. Portanto, R2 é mais útil quando comparado a modelos do mesmo tamanho.
Use R2 ajustado quando desejar comparar modelos que têm diferentes números de preditores. R2 sempre aumenta quando você adiciona um preditor ao modelo, mesmo quando não existe uma verdadeira melhoria ao modelo. O valor de R2 ajustado incorpora o número de preditores no modelo para ajudá-lo a escolher o modelo correto.
Amostras pequenas não fornecem uma estimativa precisa da força da relação entre a resposta e os preditores. Por exemplo, se você precisar que R2 seja mais exato, deve usar uma amostra maior (geralmente, 40 ou mais).
A estatística de qualidade do ajuste é apenas uma medida do grau em que o modelo ajusta os dados (se ajusta bem ou mal). Mesmo quando um modelo tem um um valor desejável, você deve verificar os gráficos de resíduos para conferir se o modelo atende aos pressupostos do modelo.
S | R2 | R2(aj) |
---|---|---|
7,56342 | 89,13% | 88,29% |
Nesses resultados, a densidade do aglomerado explica aproximadamente 89% da variação na dureza das placas. O valor de R2 indica que o modelo ajusta bem os dados.
Use os gráficos de resíduos para ajudar a determinar se o modelo é adequado e satisfaz aos pressupostos da análise. Se os pressupostos não forem satisfeitos, o modelo pode não ajustar bem os dados e você deve ter cautela ao interpretar os resultados.
Use o gráfico de resíduos versus ajustes para verificar a pressuposição de que os resíduos são aleatoriamente distribuídos e têm variância constante. De maneira ideal, os pontos devem cair aleatoriamente em ambos os lados de 0, sem padrões reconhecíveis nos pontos.
Padrão | O que o padrão pode indicar |
---|---|
Dispersão grande ou irregular de resíduos entre valores ajustados | Variância não constante |
Curvilíneo | Um termo de ordem mais alta ausente |
Um ponto que está distante de zero | Um outlier |
Um ponto que é distante dos outros pontos na direção x | Um ponto influente |
Use o gráfico de probabilidade normal de resíduos para verificar a pressuposição de que os resíduos são distribuídos normalmente. O gráfico de probabilidade normal dos resíduos deve seguir aproximadamente uma linha reta.
Padrão | O que o padrão pode indicar |
---|---|
Não é uma linha reta | Não normalidade |
Um ponto que está distante da linha | Um outlier |
Inclinação em alteração | Uma variável não identificada |
Para obter mais informações sobre como lidar com padrões nos gráficos de resíduos, vá para Gráficos de resíduos para Gráfico de linha ajustada.