Si agrega la validación con un conjunto de pruebas a la validación out-of-bag, la tabla incluye estadísticas independientes para el conjunto de entrenamiento y para el conjunto de prueba.
La tabla incluye esta estadística al agregar la validación con un conjunto de prueba. Los números son cuántos valores de respuesta presentes existen en los conjuntos de prueba y de entrenamiento.
La tabla incluye esta estadística al agregar la validación con un conjunto de prueba. Los números son el porcentaje de observaciones que se encuentran en el conjunto de datos de entrenamiento y que se encuentran en el conjunto de datos de prueba.
Una medida frecuentemente utilizada del centro de un lote de números. La media también se denomina promedio. Es la suma de todas las observaciones dividida entre el número de observaciones (presentes).
Término | Description |
---|---|
observación | |
media de las observaciones | |
N | número de observaciones presentes |
El valor más pequeño del conjunto de datos.
25% de las observaciones de la muestra son menores que o iguales al valor del 1er cuartil. Por lo tanto, el 1er cuartil también se conoce como el percentil 25.
La mediana de la muestra está en la mitad de los datos: por lo menos la mitad de las observaciones es menor que o igual a la mediana y por lo menos la mitad de las observaciones es mayor que o igual a la mediana.
Supongamos que usted tiene un conjunto de datos que contiene N valores. Para calcular la mediana, primero ordene los valores de los datos del más pequeño al más grande. Si N es impar, la mediana de la muestra es el valor del medio. Si N es par, la mediana es el promedio de los dos valores del medio.
75% de las observaciones de la muestra son menores que o iguales al valor del tercer cuartil. Por lo tanto, el tercer cuartil también se conoce como el percentil 75.
El valor más grande del conjunto de datos.