Métodos e fórmulas para análise de variância em Análise de resposta binária para filtragem de experimentos definitiva

Análise de variância

A desviância mede a discrepância entre o modelo atual e o modelo completo. O modelo completo é o modelo que tem n parâmetros, um parâmetro por observação. O modelo completo maximiza a função log-verossimilhança. O modelo completo fornece um ponto de comparação para modelos com menos de n parâmetros. As comparações ao modelo completo usam desviância escalada.
A equação a seguir dá a contribuição da deviance em escala para um modelo binomial:

A tabela de desviância é construída com base no seguinte resultado geral que supõe que ϕ é conhecido. Se DI for a desviância associada a um modelo inicial e DS for a desviância associada a um subconjunto de termos no modelo inicial, sob algumas condições de regularidade, a seguinte relação existe:

A diferença entre as desviâncias é assintoticamente distribuída como uma distribuição qui-quadrado com d graus de liberdade. Essas estatísticas são calculadas para análise ajustada (tipo III) e análise sequencial (tipo I). A desviância ajustada e a estatística qui-quadrado na tabela de desviâncias são iguais. A desviância média ajustada é a desviância ajustada dividida pelos graus de liberdade.

Para a análise sequencial, a saída depende da ordem em que as preditoras entram no modelo. A desviância sequencial é a parte exclusiva da desviância que uma preditora explica, dadas quaisquer preditoras já no modelo. Se você tiver um modelo com três preditoras, X1, X2 e X3, a desviância sequencial para X3 mostra quanto da desviância restante que X3 explica, dado que X1 e X2 já estejam no modelo. Para obter uma desviância sequencial diferente, repita o procedimento de regressão inserindo as preditoras em uma ordem diferente.

Se ϕ for desconhecido, quanto às respostas que seguem uma distribuição normal, sob algumas condições de regularidade, a relação muda para o seguinte:

Aqui, a diferença entre as desviâncias é assintoticamente distribuída como uma distribuição F com d graus de liberdade para o numerador e np graus de liberdade para o denominador. Para estimar o parâmetro de dispersão, use o modelo inicial.

Notação

TermoDescrição
yio número de eventos da iésima linha
a resposta média estimada da iésima linha
mio número de ensaios da iésima linha
Lfa log-verossimilhança do modelo completo
Lca log-verossimilhança do modelo com um subconjunto de termos do modelo completo
dos graus de liberdade são a diferença entre os números de parâmetros nos modelos a comparar
ϕo parâmetro de dispersão, conhecido por ser 1 para o modelo binomial
no número de linhas nos dados
pos graus de liberdade da regressão do modelo inicial

Graus de liberdade (DF)

Diferentes somas de quadrados têm diferentes graus de liberdade.

DF para um fator numérico = 1

DF para um fator categórico = b − 1

DF para um termo quadrático = 1

DF para blocos = c − 1

DF para erro = n − p

DF total = n − 1

Para interações entre fatores, multiplique os graus de liberdade para os termos no fator. Por exemplo, se os fatores forem A e B, então, a interação AB tem estes graus de liberdade:
Para encontrar os graus de liberdade para um tipo de termo, some os graus de liberdade para os termos. Por exemplo, se os fatores forem A e B, então, os efeitos principais no modelo têm estes muitos graus de liberdade:
Observação

Os fatores categóricos em filtragens de experimentos no Minitab têm 2 níveis. Assim, os graus de liberdade para um fator categórico são 2 - 1 = 1. Por extensão, as interações entre fatores também têm um grau de liberdade.

Notação

TermoDescrição
bO número de níveis no fator
cO número de blocos
nO número de linhas no experimento
niO número de observações para a ia combinação de níveis de fatores
mO número de combinações de níveis de fator
pO número de coeficientes

Log-verossimilhança

As funções de log-verossimilhança são parametrizadas nos termos das médias. A forma geral das funções são as seguintes:

A forma geral das contribuições individuais são as seguintes:

A equação a seguir apresenta a forma específica das contribuições individuais para o modelo binomial:

Notação

TermoDescrição
yio número de eventos da iésima linha
mio número de ensaios da iésima linha
a resposta média estimada da iésima linha

valor-p (P)

Usado nos testes de hipóteses para ajudá-lo a decidir se deve rejeitar ou não rejeitar uma hipótese nula. O valor-p é a probabilidade de se obter uma estatística de teste que seja pelo menos tão extrema quanto o valor calculado real, se a hipótese nula for verdadeira. Um valor cortado comumente usado para o valor-p é 0,05. Por exemplo, se o valor-p calculado de uma estatística de teste for menor do que 0,05, você rejeita a hipótese nula.