Métodos e fórmulas para as medidas de diagnóstico em Ajustar modelo logístico binário e Régression logistique binaire

Selecione o método ou a fórmula de sua escolha.

Resíduos de Pearson

Elementos do qui-quadrado de Pearson que podem ser usados para detectar padrões de fator/covariável mal ajustados. O Minitab armazena o resíduo de Pearson para o iésimo padrão de fator/covariável. A fórmula é:

Notação

TermoDescrição
yio valor da resposta do iésimo padrão de fator/covariável
o valor ajustado do iésimo padrão de fator/covariável
Va função de variância do modelo em

A função de variância depende do modelo:

Modelo Função de variância
Binomial
Poisson

Resíduos de Pearson padronizados e deletados

Usados para detectar padrões de fator/covariável mal ajustados. O Minitab armazena os resíduos de Pearson padronizados para o iésimo padrão de fator/covariável. Os resíduos de Pearson deletados também são chamados de resíduos de Pearson de razão de verossimilhança. Para os resíduos de Pearson deletados, o Minitab calcula a aproximação de um passo descrita no Pregibon.1 Essa aproximação é igual aos resíduos de Pearson padronizados. A fórmula é:

Notação

TermoDescrição
o resíduo de Pearson para o iésimo padrão de fator/covariável
1, para os modelos binomial e Poisson
o leverage do iésimo padrão de fator/covariável

Resíduos de Pearson padronizados com validação

Quanto aos dados de validação, o denominador da fórmula para os resíduos de Pearson padronizados adiciona o leverage em vez de subtraí-lo.

Fórmula

Notação

TermoDescrição
the Pearson residual for the io validation row
1, for the binomial and Poisson models
the leverage for the io validation row

Resíduos deviance

Os resíduos deviance estão baseados na deviance modelo e são úteis na identificação de padrões de fatores/covariáveis mal ajustados. A deviance do modelo é uma estatísticas de qualidade do ajuste que está baseada na função de log-verossimilhança. Os resíduos deviance definidos para o iésimo padrão de fatores/covariáveis é:

Notação

TermoDescrição
yi o valor da resposta do iésimo padrão de fatores/covariáveis
o valor ajustado do iésimo padrão de fatores/covariáveis
a deviance para o iésimo padrão de fatores/covariáveis

Resíduo deviance padronizado

O resíduo deviance padronizado é útil na identificação de outliers. A fórmula é:

Notação

TermoDescrição
rD,iO resíduo de deviance para o iésimo padrão de fatores/covariáveis
hiO leverage do iésimo padrão de fatores/covariáveis

Resíduos da desviância padronizados com validação

Quanto aos dados de validação, o denominador da fórmula para os resíduos da desviância padronizados adiciona o leverage em vez de subtraí-lo.

Fórmula

Notação

TermoDescrição
rD,iThe deviance residual for the io validation row
hiThe leverage for the io validation row

Resíduo deviance deletado

Os resíduos deviance deletados medem a mudança na deviance devida à omissão do iésimo caso dos dados. Os resíduos de deviance deletados são também chamados de resíduos de deviance de razão de verossimilhança. Para os resíduos deviance deletados, o Minitab calcula uma aproximação de um passo com base no método de aproximação de um passo Pregibon1. A fórmula é a seguinte:

Notação

TermoDescrição
yio valor da resposta do iésimo padrão fator/covariável
o valor ajustado do iésimo padrão de fator ou covariável
hio leverage do iésimo padrão de fator/covariável
r'D,io resíduo de deviance padronizado para o iésimo padrão de fator/covariável
r'P,io resíduo de Pearson padronizado para o iésimo padrão de fator/covariável

1. Pregibon, D. (1981). "Diagnósticos de regressão logística". The Annals of Statistics, Vol. 9, No. 4 pp. 705–724.

Delta qui-quadrado

O Minitab calcula a mudança no qui-quadrado de Pearson devido à deleção de todas as observações com o jésimo padrão de fator/covariável. O Minitab armazena um valor de delta qui-quadrado para cada padrão de fator/covariável distinto nos dados. Você também pode usar o qui-quadrado delta para detectar padrões de fatores/covariáveis mal ajustados. A fórmula para o delta qui-quadrado é:

Fórmula

Notação

TermoDescrição
hj leverage
rj Resíduos de Pearson

Delta deviance

O Minitab calcula a mudança na estatística deviance deletando todas as observações com o jésimo padrão de fator/covariável. O Minitab armazena um valor para cada padrão de fator/covariável distinto nos dados. Você pode usar o deviance delta para detectar padrões de fatores/covariáveis mal ajustados. A mudança na estatística deviance é:

Notação

TermoDescrição
hjleverage
rjResíduos de Pearson
djresíduos deviance

Delta beta (padronizado)

O Minitab calcula a mudança deletando todas as observações com o jésimo padrão de fator/covariável. Um valor é armazenado para cada padrão de fator/covariável distinto nos dados. Você pode usar o delta padronizado β para detectar padrões de fatores/covariáveis que têm uma forte influência nas estimativas dos coeficientes. Este valor está baseado no resíduo de Pearson padronizado.

Fórmula

Notação

TermoDescrição
hj leverage
rs j resíduos de Pearson padronizados

Delta beta

O Minitab calcula a mudança deletando todas as observações com o jésimo padrão de fator/covariável. Um valor é armazenado para cada padrão de fator/covariável distinto nos dados. Você pode usar o delta β para detectar padrões de fatores/covariáveis que têm uma forte influência nas estimativas dos coeficientes. Este valor está baseado no resíduo de Pearson.

Fórmula

Notação

TermoDescrição
hj leverage
rj Resíduos de Pearson

Leverages

Os leverages são elementos diagonais da matriz de chapéu generalizada. Os leverages são úteis na detecção de padrões de fatores/covariáveis que podem ter uma influência significativa nos resultados.

Fórmula

Notação

TermoDescrição
wj o jésimo elemento diagonal da matriz ponderada a partir dos ajustes dos coeficientes
xja jésima linha da matriz de planejamento
Xa matriz de planejamento
X'a transposição do x
Wa matriz ponderada da estimativa dos coeficientes

Leverages com validação

Notação

TermoDescrição
wi the internal weight for the io validation row
xithe row of the design matrix for the predictors in the io validation row
Xthe design matrix for the training data set
X'the transpose of X
Wthe diagonal matrix of internal weights for the training data set

Distância de Cook

O Minitab calcula uma distância de Cook aproximada.

Fórmula

Notação

TermoDescrição
hio leverage do iésimo padrão de fator/covariável
o resíduo de Pearson padronizado para o iésimo padrão de fator/covariável
pos graus de liberdade da regressão

DFITS

Uma medida da influência de uma deleção única nos valores ajustados. As observações com grandes valores DFITS podem ser outliers. O Minitab calcula um valor aproximado para DFITS.

Fórmula

Notação

TermoDescrição
hiO leverage do ponto de dados
O residual de Pearson deletado do ponto de dados

Fator de inflação de variância (VIF)

Para calcular um VIF, realize uma regressão ponderada no preditor com os preditores restantes. A matriz ponderada é aquela dada em McCullagh e Nelder1 para a estimativa dos coeficientes. Neste caso, a fórmula VIF é equivalente à fórmula de uma regressão linear. Por exemplo, para o preditor xj a fórmula do VIF é:

Notação

TermoDescrição
coeficiente de determinação com xj como a variável de resposta e os outros termos no modelo como as preditores

1. P. McCullagh and J. A. Nelder (1989). Generalized Linear Models, 2a Edição, Chapman & Hall/CRC, Londres.