Use o processo a seguir para encontrar as coordenadas x e y do gráfico.
Por exemplo, suponha que a tabela a seguir sumariza uma árvore com 4 nós terminais:
A: Nó terminal | B: Número de eventos | C: Número de não eventos | D: Número de casos | E: Limite (B/D) |
---|---|---|---|---|
4 | 18 | 12 | 30 | 0,60 |
1 | 25 | 42 | 67 | 0,37 |
3 | 12 | 44 | 56 | 0,21 |
2 | 4 | 32 | 36 | 0,11 |
Totais | 59 | 130 | 189 |
A seguir estão as 4 tabelas correspondentes com suas respectivas taxas falsos positivos e taxas de positivos verdadeiros para 2 casas decimais:
Predito | |||
---|---|---|---|
evento | não evento | ||
Observado | evento | 18 | 41 |
não evento | 12 | 118 |
Predito | |||
---|---|---|---|
evento | não evento | ||
Observado | evento | 43 | 16 |
não evento | 54 | 76 |
Predito | |||
---|---|---|---|
evento | não evento | ||
Observado | evento | 55 | 4 |
não evento | 98 | 32 |
Predito | |||
---|---|---|---|
evento | não evento | ||
Observado | evento | 59 | 0 |
não evento | 130 | 0 |
Use os mesmos passos do procedimento de conjunto de dados de treinamento, mas calcule a probabilidade de evento dos casos para o conjunto de dados de teste.
O procedimento para definir as coordenadas x e y no gráfico da curva ROC com validação cruzada de K dobras tem um passo adicional. Este passo cria muitas probabilidades de evento distintas. Por exemplo, suponha que o diagrama da árvore contenha 4 nós terminais. Temos uma validação cruzada de 10 dobras Em seguida, para a ia dobra, você usa a 9/10 porção dos dados para estimar as probabilidades de evento para casos na dobra i. Quando este processo se repete para cada dobra, o número máximo de probabilidades distintas de evento é de 4 *10 = 40. Depois disso, ordene todas as probabilidades de evento distintas em ordem decrescente. Use as probabilidades de evento como cada um dos valores de limite para atribuir classes preditas para casos em todo o conjunto de dados. Após este passo, do passo 3 até o final para o procedimento de conjunto de dados de treinamento são aplicadas para que seja possível localizar as coordenadas x e y.