Tabela de análise de variância para Ajuste do modelo de regressão e Régression linéaire

Encontre definições e interpretações para cada estatística na tabela Análise de Variância.

DF

Os graus de liberdade (DF) são a quantidade de informações em seus dados. A análise usa essas informações para estimar os valores de parâmetros populacionais desconhecidos. O DF total é determinado pelo número de observações em sua amostra. O DF para um termo mostra a quantidade de informação que o termo usa. Aumentar o tamanho da amostra fornece mais informações sobre a população, que aumenta o DF total. Aumentar o número de termos em seu modelo usa mais informações, o que diminui o DF disponível para estimar a variabilidade das estimativas dos parâmetros.

Se estiverem reunidas duas condições, então o Minitab particiona o DF para erro. A primeira condição é que deve haver termos que possam ser ajustados com os dados que não estão incluídos no modelo atual. Por exemplo, se você tiver um preditor contínuo com 3 valores distintos ou mais, é possível estimar um termo quadrático para esse preditor. Se o modelo não inclui o termo quadrático, então, um termo que os dados possam ajustar não está incluído no modelo e esta condição é satisfeita.

A segunda condição é de que os dados contenham replicações. As replicações são observações onde cada preditor tem o mesmo valor. Por exemplo, se você tiver 3 observações, onde a pressão é 5 e a temperatura é de 25, então, essas observações são 3 replicações.

Se estiverem reunidas as duas condições, então as duas partes do DF para erro são teste de ajuste (lack-of-fit) e erro puro. O DF para o teste de ajuste (lack-of-fit) permite um teste para saber se o modelo é adequado. O teste de ajuste (lack-of-fit) utiliza os graus de liberdade para detecção de ajuste (lack-of-fit). Quanto mais DF para erro puro, maior o poder do teste de ajuste (lack-of-fit).

Adj SS

A soma dos quadrados ajustada é uma medida da variação para os diferentes componentes do modelo. A ordem dos preditores do modelo não afeta o cálculo da soma dos quadrados ajustada. Na tabela de análise de variância, o Minitab separa as somas dos quadrados em diferentes componentes que descrevem a variação devida a várias fontes.

Termo SS ajust
A soma dos quadrados ajustada para um termo é o aumento na soma dos quadrados de regressão em relação a um modelo com apenas os outros termos. Ele quantifica o montante de variação nos dados de resposta que é explicado por cada termo no modelo.
Erro de SS ajust
O erro da soma dos quadrados é a soma dos resíduos quadrados. Ela quantifica a variação nos dados que os preditores não explicam.
Total de SS Adj
A soma dos quadrados total é a soma da soma dos quadrados do termo e a soma dos quadrados dos erros. Ela quantifica a variação total nos dados.

Interpretação

O Minitab usa a soma dos quadrados ajustadas para calcular o valor-p para um termo. O Minitab também usa a soma dos quadrados para calcular a estatística R2. Normalmente, você interpreta os valores-p e a estatística R2 em vez da soma dos quadrados.

Adj MS

Os quadrados médios ajustados medem o quanto a variação de um termo ou um modelo explica, assumindo que todos os outros termos estão no modelo, independentemente da ordem em que foram inseridos. Diferentemente das somas dos quadrados ajustadas, os quadrados médios ajustados considerar os graus de liberdade.

O quadrado médio do erro ajustado (também chamado MSE ou s2) é a variância em torno dos valores ajustados.

Interpretação

O Minitab usa os quadrados médios ajustados para calcular o valor de p para um termo. O Minitab também usa os quadrados médios ajustados para calcular a estatística R2 ajustada. Normalmente, você interpreta os valores de p e a estatística R2 ajustada em vez dos quadrados médios ajustados.

Seq SS

As somas dos quadrados sequenciais são medidas da variação para os diferentes componentes do modelo. Diferente das somas dos quadrados ajustados, a soma sequencial dos quadrados depende da ordem em que os termos são inseridos no modelo. Na tabela Análise de Variância, o Minitab separa as somas dos quadrados sequenciais em diferentes componentes que descrevem a variação devida a diferentes fontes.

Regressão de Seq SS
A regressão da soma de quadrados é a soma dos desvios quadrados dos valores de resposta ajustados do valor de resposta médio. Ela quantifica a quantidade da variação nos dados da resposta que são explicados pelo modelo.
Termo SS seq
A soma dos quadrados sequenciais para um termo é a parte única da variação explicada por um termo que não é explicado pelos termos digitados anteriormente. Ele quantifica o montante de variação nos dados de resposta que é explicado por cada termo conforme ele é adicionado sequencialmente ao modelo.
Erro de SS seq
O erro da soma dos quadrados é a soma dos resíduos quadrados. Ela quantifica a variação nos dados que os preditores não explicam.
Total Seq SS
A soma dos quadrados total é a soma do termo sequencial da soma de quadrados e o erro da soma de quadrados. Ela quantifica a variação total nos dados.

Interpretação

Por padrão, as somas ajustadas de quadrados são usadas para calcular o valor-p para um termo. Quando apropriado, é possível calcular o valor-p para um termo a partir da soma dos quadrados sequencial. Em geral, você interpreta os valores-p em vez das somas de quadrados.

MS Seq

Os quadrados médios sequenciais medem o quanto a variação de um termo ou de um modelo explica. Os quadrados médios sequenciais dependem da ordem em que os termos são inseridos no modelo. Ao contrário das somas dos quadrados, os quadrados médios sequenciais consideram os graus de liberdade.

O quadrado médio do erro sequencial (também chamado MSE ou s2) é a variância em torno dos valores ajustados.

Interpretação

O Minitab usa os quadrados médios sequenciais para calcular o valor de p para um termo. O Minitab também usa os quadrados médios sequenciais para calcular a estatística R2 ajustada. Normalmente, você interpreta os valores de p e a estatística R2 ajustada em vez dos quadrados médios sequenciais.

Contribuição

A contribuição exibe a porcentagem que cada fonte na tabela Análise de Variância contribui para o total das somas sequenciais dos quadrados (SS Seq).

Interpretação

Percentagens mais elevadas indicam que a fonte é responsável por mais da variação na resposta.

Valor-f

Aparece um Valor de F para cada termo na análise da tabela de variância:
F-valor para o modelo ou os termos
O valor-f é a estatística de teste usado para determinar se o termo está associado com a resposta.
Valor-f para o teste de ajuste (lack-of-fit)
O valor-f é a estatística de teste usada para determinar se no modelo estão faltando termos de ordem mais alta, que incluem as preditoras no modelo atual.

Interpretação

O Minitab usa a o valor de F para calcular o valor de p, que pode ser usado para a tomada de uma decisão sobre a significância estatística dos termos e do modelo. O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula.

Um valor de F grande o bastante indica que o termo ou modelo é significativo.

Se você quiser usar o valor-f para determinar se deve rejeitar a hipótese nula, compare o valor-f com o seu valor crítico. É possível calcular o valor crítico no Minitab ou encontrar o valor crítico de uma tabela distribuição F na maioria dos livros de estatísticas. Para obter mais informações sobre como usar o Minitab para calcular o valor crítico, acesse Usando a função de distribuição acumulada inversa (ICDF) e clique em "Usar o ICDF para calcular valores críticos".

Valor-p - regressão

O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula.

Interpretação

Para determinar se o modelo explica a variação na resposta, compare o valor-p do modelo com o seu nível de significância para avaliar a hipótese nula. A hipótese nula para a regressão global é que o modelo não explica nenhuma variação na resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de concluir que o modelo explica a variação na resposta quando isso não acontece.
Valor-p ≤ α: o modelo explica a variação na resposta
Se o valor p for menor ou igual ao nível de significância, você conclui que o modelo explica a variação na resposta.
Valor-p > α: não há evidências suficientes para concluir que o modelo explica a variação na resposta

Se o valor p for maior ou igual ao nível de significância, não é possível concluis que o modelo explica a variação na resposta. Talvez você deseje ajustar um novo modelo.

Valor-p - termo

O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula.

Interpretação

Para determinar se a associação entre a resposta e cada termo no modelo é estatisticamente significativa, compare o valor-p para o termo com o seu nível de significância a fim de avaliar a hipótese nula. A hipótese nula é que não há nenhuma associação entre o termo e a resposta. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de se concluir que existe uma associação quando não existe uma associação real.
Valor-p ≤ α: a associação é estatisticamente significativa
Se o valor-p for menor ou igual ao nível de significância, é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo.
Valor-p > α: a associação não é estatisticamente significativa
Se o valor-p for maior ou igual ao nível de significância, não é possível concluir que há uma associação estatisticamente significativa entre a variável de resposta e o termo. Talvez seja necessário reajustar o modelo sem o termo.
Se houver vários preditores sem uma associação estatisticamente significativa com a resposta, você pode reduzir o modelo removendo os termos um de cada vez. Para obter mais informações sobre como remover os termos do modelo, vá para Redução de modelo.
Se um termo do modelo for estatisticamente significativo, a interpretação dependerá do tipo de termo. As interpretações são da seguinte maneira:
  • Se um preditor contínuo for significativo, é possível concluir que o coeficiente para o indicador não é igual a zero.
  • Se uma preditora categórica for significativa, é possível concluir que nem todas as médias de nível são iguais.
  • Se um termo de interação for significativa, é possível concluir que a relação entre um preditor e que a resposta depende dos outros preditores no termo.
  • Se um termo polinomial for significativo, é possível concluir que os dados contêm curvatura.

Valor de p – teste de ajuste (lack-of-fit)

O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. As probabilidades inferiores fornecem evidências mais fortes contra a hipótese nula. O Minitab executa automaticamente o teste de ajuste (lack-of-fit) de erro puro quando os seus dados contêm repetições, que são múltiplas observações com valores x idênticos. As replicações representam o "erro puro", pois apenas a variação aleatória pode causar diferenças entre os valores de resposta observados.

Interpretação

Para determinar se o modelo especifica corretamente a relação entre a resposta e os preditores, compare o valor-p para o teste de ajuste (lack-of-fit) com o seu nível de significância para avaliar a hipótese nula. A hipótese nula para o teste de ajuste (lack-of-fit) é que o modelo especifica corretamente a relação entre a resposta e os preditores. Em geral, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica um risco de 5% de concluir que o modelo não especifica corretamente a relação entre a resposta e os preditores quando o modelo não especifica a relação correta.
Valor-p ≤ α: o teste de ajuste (lack-of-fit) é estatisticamente significativo
Se o valor-p for menor ou igual ao nível de significância, conclua que o modelo não especifica corretamente a relação. Para melhorar o modelo, talvez seja necessário adicionar termos ou transformar seus dados.
Valor-p ≤ α: o teste de ajuste (lack-of-fit) não é estatisticamente significativo

Se o valor-p for maior do que o nível de significância, o teste não detecta nenhum teste de ajuste (lack-of-fit).