Métodos e fórmulas para a análise da variância em Ajustar modelo logístico binário e Régression logistique binaire

Selecione o método ou a fórmula de sua escolha.

Análise de variância

A desviância mede a discrepância entre o modelo atual e o modelo completo. O modelo completo é o modelo que tem n parâmetros, um parâmetro por observação. O modelo completo maximiza a função log-verossimilhança. O modelo completo fornece um ponto de comparação para modelos com menos de n parâmetros. As comparações ao modelo completo usam desviância escalada.

A contribuição à deviance escalada de cada ponto de dados do indivíduo depende do modelo.

Modelo Desviância
Binomial
Poisson

A tabela de desviância é construída com base no seguinte resultado geral que supõe que ϕ é conhecido. Se DI for a desviância associada a um modelo inicial e DS for a desviância associada a um subconjunto de termos no modelo inicial, sob algumas condições de regularidade, a seguinte relação existe:

A diferença entre as desviâncias é assintoticamente distribuída como uma distribuição qui-quadrado com d graus de liberdade. Essas estatísticas são calculadas para análise ajustada (tipo III) e análise sequencial (tipo I). A desviância ajustada e a estatística qui-quadrado na tabela de desviâncias são iguais. A desviância média ajustada é a desviância ajustada dividida pelos graus de liberdade.

Para a análise sequencial, a saída depende da ordem em que as preditoras entram no modelo. A desviância sequencial é a parte exclusiva da desviância que uma preditora explica, dadas quaisquer preditoras já no modelo. Se você tiver um modelo com três preditoras, X1, X2 e X3, a desviância sequencial para X3 mostra quanto da desviância restante que X3 explica, dado que X1 e X2 já estejam no modelo. Para obter uma desviância sequencial diferente, repita o procedimento de regressão inserindo as preditoras em uma ordem diferente.

Se ϕ for desconhecido, quanto às respostas que seguem uma distribuição normal, sob algumas condições de regularidade, a relação muda para o seguinte:

Aqui, a diferença entre as desviâncias é assintoticamente distribuída como uma distribuição F com d graus de liberdade para o numerador e np graus de liberdade para o denominador. Para estimar o parâmetro de dispersão, use o modelo inicial.

Notação

TermoDescrição
yio número de eventos da iésima linha
a resposta média estimada da iésima linha
mio número de ensaios da iésima linha
Lfa log-verossimilhança do modelo completo
Lca log-verossimilhança do modelo com um subconjunto de termos do modelo completo
dos graus de liberdade são a diferença entre os números de parâmetros nos modelos a comparar
ϕo parâmetro de dispersão, conhecido como 1 para o binômio e os modelos de Poisson
no número de linhas nos dados
pos graus de liberdade da regressão do modelo inicial

Graus de liberdade (DF)

Indica o número de informações independentes que envolvem os dados de resposta necessários para calcular os deviances médios ajustados. Os graus de liberdade de cada componente do modelo são:
Fonte da variação DF
Regressão p
Erro np − 1
Total n − 1
Preditoras contínuas 1
Preditoras categóricas q − 1

Notação

TermoDescrição
pA soma dos graus de liberdade das preditoras. As preditoras não incluem a constante.
nO número de observações no conjunto de dados
qO número de níveis da preditora categórica

Log-verossimilhança

As funções de log-verossimilhança são parametrizadas nos termos das médias. A forma geral das funções são as seguintes:

A forma geral das contribuições individuais são as seguintes:

A forma específica das contribuições individuais depende do modelo.

Modelo li
Binomial
Poisson

Notação

TermoDescrição
yio número de eventos da iésima linha
mio número de ensaios da iésima linha
a resposta média estimada da iésima linha

valor-p (P)

Usado nos testes de hipóteses para ajudá-lo a decidir se deve rejeitar ou não rejeitar uma hipótese nula. O valor-p é a probabilidade de se obter uma estatística de teste que seja pelo menos tão extrema quanto o valor calculado real, se a hipótese nula for verdadeira. Um valor cortado comumente usado para o valor-p é 0,05. Por exemplo, se o valor-p calculado de uma estatística de teste for menor do que 0,05, você rejeita a hipótese nula.