Ajustes y estadísticas de error para nodos terminales en Regresión CART®

Seleccione el método o la fórmula de su elección.

Las estadísticas de nodo proceden de los datos de nodos individuales. Cuando se utiliza un método de validación, el ajuste para un nodo es el mismo independientemente de que esté en el conjunto de datos de prueba o en el conjunto de datos de entrenamiento. Las otras estadísticas utilizan los registros del nodo del conjunto de datos de entrenamiento o prueba.

Estas estadísticas aparecen en la tabla de los mejores o peores nodos terminales. En general, las filas están en orden por el tamaño del error, bien sea MSE o MAD. Cuando ambos valores son menores que 1, los valores dentro de 1E-12 son empates. Cuando cualquiera de los valores de error es mayor que 1, los valores dentro de 1E-12* (valor más grande) son empates. Minitab ordena los empates por sus conteos ponderados. Si los conteos ponderados también son empates, Minitab ordena los empates por el ID de nodo.

Ajuste

El ajuste depende del criterio para la mejora de un nodo. Cuando el criterio es de mínimos cuadrados, entonces el ajuste es la media:

Cuando el criterio es la desviación absoluta mínima, entonces el ajuste es la mediana.

Desv.Est

MSE

MAD

EPAM

Notación

TérminoDescription
valor ajustado para el nodo k-ésimo
yi i -ésimo valor de respuesta observado en el nodo k-ésimo
respuesta media para los registros en el nodo k-ésimo
nkrecuento de registros en el nodo k-ésimo
nk, tcrecuento de registros en el nodo k-ésimo para observaciones en el conjunto de datos de entrenamiento o en el conjunto de datos de prueba
yi, t i -ésimo observó el valor de respuesta en el nodok-ésimo para el conjunto de datos de entrenamiento o los datos de prueba Establecer
respuesta media para los registros en el nodo k-ésimo en el conjunto de datos de entrenamiento o los datos de prueba Establecer