Métodos e fórmulas para fatores aleatórios e modelos mistos em Ajustar modelo linear generalizado

Selecione o método ou a fórmula de sua escolha.

Componentes da variância

O Minitab calcula os componentes de variância apenas para fatores aleatórios. Um modelo com dois fatores aleatórios é usado para apresentar as fórmulas.

onde, αi, βj , (αβ)ij e εijk são variáveis aleatórias independentes. As variáveis são normalmente distribuídas com média zero e variações destas fórmulas dadas por:

Estas variâncias são os componentes de variância. Neste caso, teste a hipótese de que os componentes de variância são iguais a zero.

Para um modelo misto sem restrições, com um fator fixo, A, e um fator aleatório, B, esta fórmula descreve o modelo:

em que αi são efeitos fixos e βj, (αβ)ij e εijk são variáveis aleatórias não correlacionadas com médias zero e estas variâncias:

Estas variâncias são os componentes de variância. O Σα i = 0.

Estas informações são para modelos balanceados. Para obter informações sobre modelos não balanceados ou mais complexos, consulte Montgomery1 e Neter2.

  1. D.C. Montgomery (1991). Design and Analysis of Experiments, Third Edition. John Wiley & Sons.
  2. J. Neter, W. Wasserman and M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Quadrados médios esperados

As fórmulas para os quadrados médios esperados para um modelo de efeitos aleatórios com dois fatores, A e B são:

As fórmulas para os quadrados médios esperados para um modelo misto irrestrito com um fator fixo, A, e um fator aleatório, B, são:

Para as regras gerais sobre o cálculo dos quadrados médios esperados e para obter informações sobre modelos desbalanceados ou mais complexos, consulte Montgomery1 e Neter2.

  1. D.C. Montgomery (1991). Design and Analysis of Experiments, Third Edition. John Wiley & Sons.
  2. J. Neter, W. Wasserman and M.H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Notação

TermoDescrição
bnúmero de níveis no fator B
anúmero de níveis no fator A
nnúmero de observações em cada combinação de níveis de fatores
σ2variância estimada do modelo
variância estimada de A
variância estimada de B
variância estimada de AB
efeitos fixos de A

Estatística-f para modelos com fatores aleatórios

Como as estatísticas F são calculadas na saída da ANOVA

Cada estatística F é uma razão de quadrados médios. O numerador é o quadrado médio para o termo. O denominador é escolhido de tal modo que o valor esperado do quadrado médio do numerador difere do valor esperado do quadrado médio do denominador apenas pelo efeito de interesse. O efeito para um termo aleatório é representado pelo componente de variância do termo. O efeito para um termo fixo é representado pela soma dos quadrados dos componentes do modelo associada a esse termo dividida por seus graus de liberdade. Por conseguinte, uma estatística F elevada indica um efeito significativo.

Quando todos os termos do modelo são fixos, o denominador para cada estatística F é o quadrado médio do erro (MSE). No entanto, para modelos que incluem termos aleatórios, o MSE não é sempre o quadrado médio correto. Os quadrados médios esperados (EMS) podem ser utilizados para determinar qual é apropriado para o denominador.

Exemplo

Suponha que você efetuou uma ANOVA com o fator fixo Screen e o fator aleatório Tech, e obteve a seguinte saída para o EMS:
Fonte Média Quadrada Esperada para Cada Termo
(1) Tela (4) + 2.0000(3) + Q[1]
(2) Tec (4) + 2,0000(3) + 4,0000(2)
(3) tela * Tec (4) + 2,0000(3)
(4) Erro (4)

Um número entre parênteses indica um efeito aleatório associado ao termo relacionado ao lado do número de fonte. (2) representa o efeito aleatório de Tech, (3) representa o efeito aleatório da interação de Screen*Tech, e (4) representa o efeito aleatório de Erro. O EMS para Erro é o efeito do termo de erro. Além disso, o EMS para Screen*Tech é o efeito do termo de erro mais duas vezes o efeito da interação Screen*Tech.

Para calcular a estatística F para Screen*Tech, o quadrado médio para Screen*Tech é dividido pelo quadrado médio do erro, de forma que o valor esperado do numerador (EMS para Screen*Tech = (4) + 2,0000 (3) ) difere do valor esperado do denominador (EMS para o erro = (4)) apenas pelo efeito da interação (2,0000 (3)). Por isso, uma estatística F elevada indica uma interação Screen*Tech significativa.

Um número com Q[ ] indica um efeito fixo associado ao termo relacionado ao lado do número de fonte. Por exemplo, Q[1] é o efeito fixo de Tela. O EMS para Tela é o efeito do termo de erro mais duas vezes o efeito da interação Tela*Tec mais uma constante vezes o efeito da tela. Q[1] é igual a (b*n * (soma ((coeficientes para níveis de Tela)**2)) dividida por (a - 1), em que a e b são o número de níveis de Tela e Tech, respectivamente, e n é o número de replicações.

Para calcular a primeira estatística para Tela * Tec, a média quadrada para Tela * Tec é dividida pela média quadrada do erro de forma que o valor esperado do numerador (EMS para Tela * Tec = (4) + 2,0000(3) + Q[1]) difere do valor esperado do denominador (EMS para Tela * Tec = (4) + 2,0000(3)) somente pelo efeito de Tela Q[1]). Por isso, uma estatística F elevada indica uma interação Screen significativa.

Por que a saída da ANOVA inclui um "x" ao lado de um valor p na tabela ANOVA e o rótulo "Não é um teste F exato"?

Um teste F exato para um termo é um dos quais o valor esperado da média quadrada do numerador difere do valor esperado da média quadrada do denominador apenas pelo componente de variância ou o fator de interesse fixo.

Algumas vezes, porém, não é possível calcular a média quadrada. Nesse caso, o Minitab usa uma média quadrada que resulte em um teste F aproximado e exibe "x" ao lado do valor de p para identificar que o teste F não é exato.

Por exemplo, suponha que você efetuou uma ANOVA com o fator fixo Suplemento e o fator aleatório Lago e obteve a seguinte saída para as médias quadradas esperadas (EMS):
Fonte Média Quadrada Esperada para Cada Termo
(1) Suplemento (4) + 1,7500(3) + Q[1]
(2) Lago (4) + 1,7143(3) + 5,1429(2)
(3) Suplemento * Lago (4) + 1,7500(3)
(4) Erro (4)

A estatística F para o suplemento é a média quadrada de Suplement dividida pela média quadrada da interação Supplement*Lake. Se o efeito para Suplement for pequeno demais, o valor esperado do numerador é igual ao valor esperado do denominador. Este é um exemplo de um teste F exato.

Observe, no entanto, que, para um efeito pequeno demais de Lake, não existem médias quadradas de forma que o valor esperado do numerador é igual ao valor esperado do denominador. Portanto, o Minitab usa um teste F aproximado. Neste exemplo, a média quadrada de Lake é dividida pela média quadrado para a interação Supplement*Lake. Isto resulta em um valor esperado do numerador aproximadamente igual ao do denominador caso o efeito de Lake seja muito pequeno.

Sobre a mensagem "Denominador do teste F zero ou não definido"

O Minitab exibe um erro de que o denominador do teste F é zero ou não definido por um dos motivos a seguir:
  • Não existe pelo menos um grau de liberdade para erro.
  • Os valores de MS ajustados são muito pequenos e, portanto, não há de precisão suficiente para exibir o F e os valoresdep. Como solução, multiplique a coluna de resposta por 10. Em seguida, realize o mesmo modelo de regressão, mas, em vez disso, use esta nova coluna de resposta para a resposta.

    Observação

    Multiplicar os valores de resposta por 10 não afetará os valores de F e de p que o Minitab exibe na saída. No entanto, a posição decimal será afetada na saída restante, especificamente, as colulas das somas dos quadrados sequenciais, Adj SS, Adj MS, Ajuste, erro padrão dos ajustes e dos resíduos.

Como as estatísticas F são calculadas na saída da ANOVA

Cada estatística F é uma razão de quadrados médios. O numerador é o quadrado médio para o termo. O denominador é escolhido de tal modo que o valor esperado do quadrado médio do numerador difere do valor esperado do quadrado médio do denominador apenas pelo efeito de interesse. O efeito para um termo aleatório é representado pelo componente de variância do termo. O efeito para um termo fixo é representado pela soma dos quadrados dos componentes do modelo associada a esse termo dividida por seus graus de liberdade. Por conseguinte, uma estatística F elevada indica um efeito significativo.

Quando todos os termos do modelo são fixos, o denominador para cada estatística F é o quadrado médio do erro (MSE). No entanto, para modelos que incluem termos aleatórios, o MSE não é sempre o quadrado médio correto. Os quadrados médios esperados (EMS) podem ser utilizados para determinar qual é apropriado para o denominador.

Exemplo

Suponha que você efetuou uma ANOVA com o fator fixo Screen e o fator aleatório Tech, e obteve a seguinte saída para o EMS:
Fonte Média Quadrada Esperada para Cada Termo
(1) Tela (4) + 2.0000(3) + Q[1]
(2) Tec (4) + 2,0000(3) + 4,0000(2)
(3) tela * Tec (4) + 2,0000(3)
(4) Erro (4)

Um número entre parênteses indica um efeito aleatório associado ao termo relacionado ao lado do número de fonte. (2) representa o efeito aleatório de Tech, (3) representa o efeito aleatório da interação de Screen*Tech, e (4) representa o efeito aleatório de Erro. O EMS para Erro é o efeito do termo de erro. Além disso, o EMS para Screen*Tech é o efeito do termo de erro mais duas vezes o efeito da interação Screen*Tech.

Para calcular a estatística F para Screen*Tech, o quadrado médio para Screen*Tech é dividido pelo quadrado médio do erro, de forma que o valor esperado do numerador (EMS para Screen*Tech = (4) + 2,0000 (3) ) difere do valor esperado do denominador (EMS para o erro = (4)) apenas pelo efeito da interação (2,0000 (3)). Por isso, uma estatística F elevada indica uma interação Screen*Tech significativa.

Um número com Q[ ] indica um efeito fixo associado ao termo relacionado ao lado do número de fonte. Por exemplo, Q[1] é o efeito fixo de Tela. O EMS para Tela é o efeito do termo de erro mais duas vezes o efeito da interação Tela*Tec mais uma constante vezes o efeito da tela. Q[1] é igual a (b*n * (soma ((coeficientes para níveis de Tela)**2)) dividida por (a - 1), em que a e b são o número de níveis de Tela e Tech, respectivamente, e n é o número de replicações.

Para calcular a primeira estatística para Tela * Tec, a média quadrada para Tela * Tec é dividida pela média quadrada do erro de forma que o valor esperado do numerador (EMS para Tela * Tec = (4) + 2,0000(3) + Q[1]) difere do valor esperado do denominador (EMS para Tela * Tec = (4) + 2,0000(3)) somente pelo efeito de Tela Q[1]). Por isso, uma estatística F elevada indica uma interação Screen significativa.

Por que a saída da ANOVA inclui um "x" ao lado de um valor p na tabela ANOVA e o rótulo "Não é um teste F exato"?

Um teste F exato para um termo é um dos quais o valor esperado da média quadrada do numerador difere do valor esperado da média quadrada do denominador apenas pelo componente de variância ou o fator de interesse fixo.

Algumas vezes, porém, não é possível calcular a média quadrada. Nesse caso, o Minitab usa uma média quadrada que resulte em um teste F aproximado e exibe "x" ao lado do valor de p para identificar que o teste F não é exato.

Por exemplo, suponha que você efetuou uma ANOVA com o fator fixo Suplemento e o fator aleatório Lago e obteve a seguinte saída para as médias quadradas esperadas (EMS):
Fonte Média Quadrada Esperada para Cada Termo
(1) Suplemento (4) + 1,7500(3) + Q[1]
(2) Lago (4) + 1,7143(3) + 5,1429(2)
(3) Suplemento * Lago (4) + 1,7500(3)
(4) Erro (4)

A estatística F para o suplemento é a média quadrada de Suplement dividida pela média quadrada da interação Supplement*Lake. Se o efeito para Suplement for pequeno demais, o valor esperado do numerador é igual ao valor esperado do denominador. Este é um exemplo de um teste F exato.

Observe, no entanto, que, para um efeito pequeno demais de Lake, não existem médias quadradas de forma que o valor esperado do numerador é igual ao valor esperado do denominador. Portanto, o Minitab usa um teste F aproximado. Neste exemplo, a média quadrada de Lake é dividida pela média quadrado para a interação Supplement*Lake. Isto resulta em um valor esperado do numerador aproximadamente igual ao do denominador caso o efeito de Lake seja muito pequeno.

Sobre a mensagem "Denominador do teste F zero ou não definido"

O Minitab exibe um erro de que o denominador do teste F é zero ou não definido por um dos motivos a seguir:
  • Não existe pelo menos um grau de liberdade para erro.
  • Os valores de MS ajustados são muito pequenos e, portanto, não há de precisão suficiente para exibir o F e os valoresdep. Como solução, multiplique a coluna de resposta por 10. Em seguida, realize o mesmo modelo de regressão, mas, em vez disso, use esta nova coluna de resposta para a resposta.

    Observação

    Multiplicar os valores de resposta por 10 não afetará os valores de F e de p que o Minitab exibe na saída. No entanto, a posição decimal será afetada na saída restante, especificamente, as colulas das somas dos quadrados sequenciais, Adj SS, Adj MS, Ajuste, erro padrão dos ajustes e dos resíduos.