Utilisez le procédé suivant pour trouver les coordonnées X et Y sur la courbe.
Supposons, par exemple, que le tableau suivant résume les valeurs d'un arbre avec 4 nœuds terminaux :
A : Nœud terminal | B : Nombre d'événements | C : Nombre de non-événements | D : Nombre de cas | E : Seuil (B/D) |
---|---|---|---|---|
4 | 18 | 12 | 30 | 0,60 |
1 | 25 | 42 | 67 | 0,37 |
3 | 12 | 44 | 56 | 0,21 |
2 | 4 | 32 | 36 | 0,11 |
Totaux | 59 | 130 | 189 |
Les 4 tableaux suivants contiennent leurs taux de faux positifs et de vrais positifs respectifs avec 2 chiffres après la virgule :
Prévu | |||
---|---|---|---|
événement | non-événement | ||
Observé | événement | 18 | 41 |
non-événement | 12 | 118 |
Prévu | |||
---|---|---|---|
événement | non-événement | ||
Observé | événement | 43 | 16 |
non-événement | 54 | 76 |
Prévu | |||
---|---|---|---|
événement | non-événement | ||
Observé | événement | 55 | 4 |
non-événement | 98 | 32 |
Prévu | |||
---|---|---|---|
événement | non-événement | ||
Observé | événement | 59 | 0 |
non-événement | 130 | 0 |
Suivez les mêmes étapes que pour la procédure de l’ensemble de données d'apprentissage, mais calculez la probabilité d’événement à partir des cas pour l’ensemble de données de test.
La procédure de définition des coordonnées X et Y sur la courbe ROC avec validation croisée sur K partitions comporte une étape supplémentaire. Cette étape crée de nombreuses probabilités d’événement distinctes. Supposons, par exemple, que l’arborescence contienne 4 nœuds terminaux. Nous avons une validation croisée de 10 partitions. Vous utilisez ensuite une portion de 9/10 des données pour la ie partition, afin d'estimer les probabilités d'événements pour les cas de la partition i. Lorsque ce procédé se répète pour chaque partition, le nombre maximal de probabilités d'événements distinctes est de 4 * 10 = 40. Après cela, triez toutes les probabilités d’événement distinctes dans l’ordre décroissant. Utilisez les probabilités d’événement pour chacune des valeurs seuils pour affecter les classes prévues aux cas dans tout l’ensemble de données. Après cette étape, appliquez l’étape 3 jusqu’à la dernière étape de la procédure d’ensemble de données d'apprentissage pour trouver les coordonnées X et Y.