Mesures du degré d'association pour la fonction Analyser une réponse binaire pour un plan de criblage définitif

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique fournie dans le tableau des mesures d'association.

Paires

Pour la régression logistique binaire, chaque événement observé est apparié avec chaque non-événement. Les catégories suivantes décrivent les différents types de paires :
  • Concordante : la probabilité prévue que l'événement survienne est supérieure pour l'observation où l'événement s'est produit.
  • Discordante : la probabilité prévue que l'événement survienne est inférieure pour l'observation où l'événement s'est produit.
  • Ex aequo : la probabilité prévue que l'événement survienne est égale pour l'observation où l'événement s'est produit et l'observation où le non-événement s'est produit.

Interprétation

Vous pouvez utiliser les nombres de paires pour comparer les performances de prévision des modèles. Plus le pourcentage de paires concordantes est élevé, plus le modèle est performant.

D de Somers

Le D de Somers est la différence en proportion entre les paires concordantes et discordantes, en tenant compte des paires ex aequo.

Interprétation

Utilisez le D de Somers pour comparer les performances de prévision des modèles. Des valeurs élevées indiquent de meilleures performances de prévision. Par exemple, si 75 % des paires sont concordantes et 25 % sont discordantes, le D de Somers est de 0,5.

Les statistiques D de Somers et gamma de Goodman-Kruskal sont identiques lorsque le modèle ne prévoit aucune paire ex aequo. Plus les paires ex aequo sont nombreuses, plus la statistique gamma de Goodman-Kruskal dépasse le D de Somers.

Gamma de Goodman-Kruskal

Le gamma de Goodman-Kruskal est la différence en proportion entre les paires concordantes et discordantes, sans tenir compte des paires ex aequo.

Interprétation

Utilisez le gamma de Goodman-Kruskal pour comparer les performances de prévision des modèles. Des valeurs élevées indiquent de meilleures performances de prévision. Par exemple, si 75 % des paires non ex aequo sont concordantes et 25 % sont discordantes, le gamma de Goodman-Kruskal est de 0,5.

Les statistiques D de Somers et gamma de Goodman-Kruskal sont identiques lorsque le modèle ne prévoit aucune paire ex aequo. Plus les paires ex aequo sont nombreuses, plus la statistique gamma de Goodman-Kruskal dépasse le D de Somers.

Tau a de Kendall

Le Tau a de Kendall représente la différence en proportion des paires concordantes et discordantes par rapport à toutes les paires possibles, notamment les paires ayant la même valeur de réponse.

Interprétation

Utilisez le Tau a de Kendall pour comparer les performances de prévision des modèles. Des valeurs élevées indiquent de meilleures performances de prévision. Le Tau a de Kendall est toujours plus faible que les statistiques D de Somers et gamma de Goodman-Kruskal, car ces dernières ne comprennent pas de paires avec la même valeur de réponse.