Méthodes et formules pour le récapitulatif du modèle pour la fonction Ajuster le modèle logistique binaire

Sélectionnez la méthode ou la formule de votre choix.

R2 de la somme des carrés d'écart

Le R2 de la somme des carrés d'écart indique la part de variation de la réponse expliquée par le modèle. Plus la valeur de R2 est grande, plus le modèle est ajusté aux données. La formule estla suivante :

Notation

TermeDescription
DEError Deviance
DTTotal Deviance

R2 ajusté de la somme des carrés d'écart

Le R2 ajusté de la somme des carrés d'écart rend compte du nombre de prédicteurs du modèle et est utile pour comparer des modèles avec un nombre de prédicteurs différents. La formule est la suivante :

Notation

TermeDescription
R2R2 de la somme des carrés d'écart
pdegrés de liberté de la régression
Φ1, pour le modèle binomial et le modèle de Poisson
DTsomme des carrés d'écart totale

Même si les calculs pour le R2 ajusté de la somme des carrés d'écart peuvent engendrer des valeurs négatives, Minitab affiche zéro.

Critère d'information d'Akaike (AIC)

Utilisez cette statistique pour comparer deux modèles différents. Plus l'AIC est petit, plus le modèle est adapté aux données.

Les fonctions de log de vraisemblance sont paramétrées dans les termes des moyennes. La forme générale des fonctions est la suivante :

La forme générale des contributions individuelles est la suivante :

La forme spécifique des contributions individuelles dépend du modèle.

Modèle li
Binomiale
Poisson

Notation

TermeDescription
pdegrés de liberté de la régression
Lclog de vraisemblance du modèle actuel
yinombre d'événements pour la ie ligne
minombre d'essais pour la ie ligne
réponse moyenne estimée de la ie ligne

AICc (critère d'information d'Akaike corrigé)

La valeur AICc n'est pas calculée quand .

Notation

TermeDescription
pnombre de coefficients dans le modèle, constante incluse
nnombre de lignes de données où aucune donnée n'est manquante

BIC (critère d'information bayésien)

Notation

TermeDescription
pnombre de coefficients dans le modèle, constante non incluse
nnombre de lignes de données où aucune donnée n'est manquante

R2 de la somme des carrés des écarts de test

Le R2 de la somme des carrés des écarts de test indique le degré de variation dans la réponse de l’ensemble de données de test que le modèle explique. Plus la valeur est élevée, plus le modèle correspond aux données de test.

Formule

L’équation suivante donne la formule pour le R2 de la somme des carrés des écarts de test :

où l’équation suivante représente la somme des carrés des écarts d’erreur :

et l’équation suivante représente la somme totale des carrés des écarts :
Pour les modèles avec terme d’ordonnée à l'origine, se définit par :

Pour les modèles sans terme d’ordonnée à l'origine,  = 0,5.

Notation

TermeDescription
N(Test)the number of rows in the test data set
the squared deviance residuals
yithe number of events for the ie row in the test data set
mithe number of trials for the ie row in the test data set
DE(Test)the error deviance for the test data set
DT(Test)the total deviance for the test data set

Zone située sous la courbe ROC

Formule

Minitab utilise une intégration pour la zone située sous la courbe.

Dans la plupart des cas, cette intégrale est équivalente à l’addition suivante des zones de trapézoïdes :

k est le nombre de probabilités d’événement distinctes et (x0, y0) est le point (0, 0).

Par exemple, supposons que nous ayons quatre probabilités d’événement distinctes avec les coordonnées suivantes sur la courbe ROC :
X (taux de faux positif) Y (taux de vrai positif)
0,0923 0,3051
0,4154 0,7288
0,7538 0,9322
1 1
La zone située sous la courbe ROC est donc donnée par le calcul suivant :

Notation

TermeDescription
TRP true positive rate
FPR false positive rate
TPtrue positive, events that were correctly assessed
P number of actual positive events
FPtrue negative, nonevents that were correctly assessed
N number of actual negative events
FNRfalse negative rate
TNRtrue negative rate
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique