Méthodes et formules pour le résumé du modèle dans Ajuster le modèle logistique binaire et Regressão Logística Binária

Sélectionnez la méthode ou la formule de votre choix.

Sur ce thème

R² de la somme des carrés d'écart
R² ajusté de la somme des carrés d'écart
Critère d'information d'Akaike (AIC)
AICc (critère d'information d'Akaike corrigé)
BIC (critère d'information bayésien)
R² de la somme des carrés des écarts de test
R² de la somme des carrés des écarts sur K partitions
Zone située sous la courbe ROC

R² de la somme des carrés d'écart

Le R² de la somme des carrés d'écart indique la part de variation de la réponse expliquée par le modèle. Plus la valeur de R² est grande, plus le modèle est ajusté aux données. La formule estla suivante :

Notation

Terme	Description
D_E	Error Deviance
D_T	Total Deviance

R² ajusté de la somme des carrés d'écart

Le R² ajusté de la somme des carrés d'écart rend compte du nombre de prédicteurs du modèle et est utile pour comparer des modèles avec un nombre de prédicteurs différents. La formule est la suivante :

Notation

Terme	Description
R²	R² de la somme des carrés d'écart
p	degrés de liberté de la régression
Φ	1, pour le modèle binomial et le modèle de Poisson
D_T	somme des carrés d'écart totale

Même si les calculs pour le R² ajusté de la somme des carrés d'écart peuvent engendrer des valeurs négatives, Minitab affiche zéro.

Critère d'information d'Akaike (AIC)

Utilisez cette statistique pour comparer deux modèles différents. Plus l'AIC est petit, plus le modèle est adapté aux données.

Les fonctions de log de vraisemblance sont paramétrées dans les termes des moyennes. La forme générale des fonctions est la suivante :

La forme générale des contributions individuelles est la suivante :

La forme spécifique des contributions individuelles dépend du modèle.

Modèle	l_i
Binomiale
Poisson

Notation

Terme	Description
p	degrés de liberté de la régression
L_c	log de vraisemblance du modèle actuel
y_i	nombre d'événements pour la i^e ligne
m_i	nombre d'essais pour la i^e ligne
	réponse moyenne estimée de la i^e ligne

AICc (critère d'information d'Akaike corrigé)

La valeur AICc n'est pas calculée quand .

Notation

Terme	Description
p	nombre de coefficients dans le modèle, constante incluse
n	nombre de lignes de données où aucune donnée n'est manquante

BIC (critère d'information bayésien)

Notation

Terme	Description
p	nombre de coefficients dans le modèle, constante non incluse
n	nombre de lignes de données où aucune donnée n'est manquante

R² de la somme des carrés des écarts de test

Le R² de la somme des carrés des écarts de test indique le degré de variation dans la réponse de l’ensemble de données de test que le modèle explique. Plus la valeur est élevée, plus le modèle correspond aux données de test.

Formule

L’équation suivante donne la formule pour le R² de la somme des carrés des écarts de test :

où l’équation suivante représente la somme des carrés des écarts d’erreur :

La formule de la somme des carrés des écarts totale, D_T(Test), dépend de la forme du modèle.

Logistique binaire

où, pour les modèles avec terme d'ordonnée à l'origine,

se définit par :

Pour les modèles sans terme d'ordonnée à l'origine, utilisez l'inverse de la fonction de liaison à 0. Les valeurs des fonctions de liaison dans Minitab sont les suivantes :

Fonction de liaison logit: = 0,5.
Fonction de liaison normit: = 0,5.
Fonction de liaison gompit: .

Poisson

où, pour les modèles avec terme d’ordonnée à l'origine

Pour les modèles sans terme d'ordonnée à l'origine,

Notation

Terme	Description
N(Test)	le nombre de lignes dans l'ensemble de données de test
	les valeurs résiduelles de la somme des carrés des écarts au carré
y_i	le nombre d'événements pour la i^e ligne de l'ensemble de données de test
m_i	le nombre d'essais pour la i^e ligne de l'ensemble de données de test
D_E(Test)	la somme des carrés des écarts d'erreur pour l'ensemble de données de test
D_T(Test)	la somme des carrés des écarts totale pour l'ensemble de données de test

R² de la somme des carrés des écarts sur K partitions

Le R² de la somme des carrés des écarts sur K partitions indique le degré de variation dans la réponse de l'ensemble de données de validation que le modèle explique. Plus la valeur est élevée, plus le modèle correspond aux données de test.

Où

et D_T représente la somme des carrés des écarts totale.

Notation

Terme	Description
K	nombre de partitions
n_j	effectif de l'échantillon de la partition j
	valeurs résiduelles à validation croisée pour la i^e ligne de la partition j

Zone située sous la courbe ROC

Formule

La zone située sous la courbe est l'addition des zones de trapézoïdes :

où k est le nombre de probabilités d'événements distinctes et (x₀, y₀) est le point (0, 0).

Pour calculer la zone d'une courbe à partir d'un ensemble de données de test ou à partir de données à validation croisée, utilisez les points de la courbe correspondante.

Par exemple, supposons que nous ayons quatre probabilités d’événement distinctes avec les coordonnées suivantes sur la courbe ROC :

X (taux de faux positifs)	Y (taux de vrais positifs)
0,0923	0,3051
0,4154	0,7288
0,7538	0,9322
1	1

La zone située sous la courbe ROC est donc donnée par le calcul suivant :

Notation

Terme	Description
TRP	taux de vrais positifs
FPR	taux de faux positifs
TP	vrais positifs, événements qui ont été correctement évalués
P	nombre d’événements positifs réels
FP	vrais négatifs, non-événements qui ont été correctement évalués
N	nombre d’événements négatifs réels
FNR	taux de faux négatifs
TNR	taux de vrais négatifs

Méthodes et formules pour le résumé du modèle dans Ajuster le modèle logistique binaire et Regressão Logística Binária

Sur ce thème

R2 de la somme des carrés d'écart

Notation

R2 ajusté de la somme des carrés d'écart

Notation

Critère d'information d'Akaike (AIC)

Notation

AICc (critère d'information d'Akaike corrigé)

Notation

BIC (critère d'information bayésien)

Notation

R2 de la somme des carrés des écarts de test

Formule

Notation

R2 de la somme des carrés des écarts sur K partitions

Notation

Zone située sous la courbe ROC

Formule

Notation

R² de la somme des carrés d'écart

R² ajusté de la somme des carrés d'écart

R² de la somme des carrés des écarts de test

R² de la somme des carrés des écarts sur K partitions