Métodos e fórmulas para o resumo do modelo em Ajustar modelo logístico binário

Selecione o método ou a fórmula de sua escolha.

desviância R2

O R2 deviance indica quanta variação na resposta é explicada pelo modelo. Quanto maior o R2, melhor o modelo se ajusta aos seus dados. A fórmula é:

Notação

TermoDescrição
DEError Deviance
DTTotal Deviance

R2 Deviance ajustado

O R2 deviance ajustado é responsável pelo número de preditoras no seu modelo e é útil para comparar modelos com diferentes números de preditoras. A fórmula é:

Notação

TermoDescrição
R2o R2 deviance
pos graus de liberdade da regressão
Φ1, para os modelos binomial e Poisson
DTa deviance total

Apesar dos cálculos para R2 deviance ajustado poderem produzir valores negativos, o Minitab exibe zero para esses casos.

Akaike Information Criterion (AIC)

Use esta estatística para comparar diferentes modelos. Quanto menor o AIC é, melhor o modelo se ajusta aos dados.

As funções de log-verossimilhança são parametrizadas nos termos das médias. A forma geral das funções são as seguintes:

A forma geral das contribuições individuais são as seguintes:

A forma específica das contribuições individuais depende do modelo.

Modelo li
Binomial
Poisson

Notação

TermoDescrição
pos graus de liberdade da regressão
Lca log-verossimilhança do modelo atual
yio número de eventos da iésima linha
mio número de ensaios da iésima linha
a resposta média estimada da iésima linha

AICc (Critério de Informação de Akaike Corrigido)

O AICc não é calculado quando .

Notação

TermoDescrição
po número de coeficientes no modelo, incluindo a constante
no número de linhas nos dados com dados não faltantes

BIC (Critério de Informação Bayesiano)

Notação

TermoDescrição
po número de coeficientes no modelo, sem contar com a constante
no número de linhas nos dados com dados não faltantes

R2da desviância de teste

O R2 da desviância de teste indica o quanto da variação na resposta do conjunto de dados de teste é explicado pelo modelo. Quanto maior o valor, melhor o modelo ajusta os dados de teste.

Fórmula

A equação a seguir dá a fórmula para o R2 da desviância de teste:

em que a equação a seguir representa a desviância de erro:

e a equação a seguir representa a desviância total:
Para modelos com um termo de interceptação, tem a seguinte definição:

Para modelos sem um termo de interceptação, = 0,5.

Notação

TermoDescrição
N(Test)the number of rows in the test data set
the squared deviance residuals
yithe number of events for the io row in the test data set
mithe number of trials for the io row in the test data set
DE(Test)the error deviance for the test data set
DT(Test)the total deviance for the test data set

Área sob a curva ROC

Fórmula

Para a área sob a curva, o Minitab utiliza uma integração.

Na maioria dos casos, essa integral equivale à soma das seguintes áreas de trapezoides:

em que k é o número de probabilidades de eventos distintas e (x0, y0) é o ponto (0, 0).

Por exemplo, suponha que tenhamos quatro probabilidades de eventos distintas com as seguintes coordenadas na curva ROC:
x (taxa de falsos positivos) y (taxa de positivos verdadeiros)
0,0923 0,3051
0,4154 0,7288
0,7538 0,9322
1 1
Em seguida, a área sob a curva ROC é dada pelo seguinte cálculo:

Notação

TermoDescrição
TRP true positive rate
FPR false positive rate
TPtrue positive, events that were correctly assessed
P number of actual positive events
FPtrue negative, nonevents that were correctly assessed
N number of actual negative events
FNRfalse negative rate
TNRtrue negative rate
Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política