Métodos y fórmulas para la información de respuesta para Regresión Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Si agrega la validación con un conjunto de pruebas a la validación out-of-bag, la tabla incluye estadísticas independientes para el conjunto de entrenamiento y para el conjunto de prueba.

N

La tabla incluye esta estadística al agregar la validación con un conjunto de prueba. Los números son cuántos valores de respuesta presentes existen en los conjuntos de prueba y de entrenamiento.

% de N

La tabla incluye esta estadística al agregar la validación con un conjunto de prueba. Los números son el porcentaje de observaciones que se encuentran en el conjunto de datos de entrenamiento y que se encuentran en el conjunto de datos de prueba.

Media

Una medida frecuentemente utilizada del centro de un lote de números. La media también se denomina promedio. Es la suma de todas las observaciones dividida entre el número de observaciones (presentes).

DesvEst

Si el conjunto de datos contiene con media , entonces la desviación estándar de la muestra es:
TérminoDescription
observación
media de las observaciones
Nnúmero de observaciones presentes

Mínimo

El valor más pequeño del conjunto de datos.

Q1

25% de las observaciones de la muestra son menores que o iguales al valor del 1er cuartil. Por lo tanto, el 1er cuartil también se conoce como el percentil 25.

Mediana

La mediana de la muestra está en la mitad de los datos: por lo menos la mitad de las observaciones es menor que o igual a la mediana y por lo menos la mitad de las observaciones es mayor que o igual a la mediana.

Supongamos que usted tiene un conjunto de datos que contiene N valores. Para calcular la mediana, primero ordene los valores de los datos del más pequeño al más grande. Si N es impar, la mediana de la muestra es el valor del medio. Si N es par, la mediana es el promedio de los dos valores del medio.

Q3

75% de las observaciones de la muestra son menores que o iguales al valor del tercer cuartil. Por lo tanto, el tercer cuartil también se conoce como el percentil 75.

Máximo

El valor más grande del conjunto de datos.