La tabla de clasificación errónea no está presente cuando el método de división es la probabilidad de clase.
Cuando no hay ponderaciones, los conteos y los tamaños de muestra son iguales.
Nivel de respuesta | Nivel pronosticado | Ponderación |
---|---|---|
Sí | Sí | 0.1 |
Sí | Sí | 0.2 |
Sí | No | 0.3 |
Sí | No | 0.4 |
No | No | 0.5 |
No | No | 0.6 |
No | Sí | 0.7 |
No | Sí | 0.8 |
Clase real | Conteo ponderado | Clasificación errónea | Clase pronosticada = No | Porcentaje correcto |
---|---|---|---|---|
Sí | 0.1 + 0.2 + 0.3 + 0.4 = 1 | 0.1 + 0.2 = 0.3 ≈ 0 | 0.3 + 0.4 = 0.7 ≈ 1 | (0.3 / 1.0) ×100 = 30% |
No | 0.5 + 0.6 + 0.7 + 0.8 = 2.6 ≈ 3 | 0.7 + 0.8 = 1.5 ≈ 2 | 0.5 + 0.6 = 1.1 ≈ 1 | 1.1 / 2.6) × 100 = 42.31% |
Todos | 1 + 2.6 = 3.6 ≈ 4 | 0.3 + 1.5 = 1.8 ≈ 2 | 0.7 + 1.1 = 1.8 ≈ 2 | (0.3 + 1.1) / 3.6 × 100 = 38.89% |
En el caso ponderado, utilice conteos ponderados en lugar de conteos.
El cálculo del costo depende de si la variable de respuesta es binaria o multinomial.
Costo (% Error ? Costo de clasificación errónea de entrada para la clase) / 100
La ecuación siguiente proporciona el costo de la clase de evento:
La ecuación siguiente proporciona el costo para la clase de no evento:
La siguiente ecuación proporciona el costo total para todas las clases:
La siguiente ecuación proporciona el costo total para el caso multinomial:
Por ejemplo, considere una variable de respuesta con 3 clases y los siguientes costos de clasificación errónea:
Clase de predicción | |||
Clase real | 1 | 2 | 3 |
1 | 0.0 | 4.1 | 3.2 |
2 | 5.6 | 0.0 | 1.1 |
3 | 0.4 | 0.9 | 0.0 |
A continuación, tenga en cuenta que la tabla siguiente proporciona los porcentajes de error:
Clase de predicción | |||
Clase real | 1 | 2 | 3 |
1 | N/A | 1% | 0.5% |
2 | 1.4% | N/A | 2.1% |
3 | 5% | 1.2% | N/A |
Por último, tenga en cuenta que las clases de la variable de respuesta tienen las siguientes probabilidades a priori:
La siguiente ecuación proporciona el costo total: