Ajustes y estadísticas de error para nodos terminales en CART® Regresión

Seleccione el método o la fórmula de su elección.

Las estadísticas de nodo proceden de los datos de nodos individuales. Cuando se utiliza un método de validación, el ajuste para un nodo es el mismo independientemente de que esté en el conjunto de datos de prueba o en el conjunto de datos de entrenamiento. Las otras estadísticas utilizan los registros del nodo del conjunto de datos de entrenamiento o prueba.

Estas estadísticas aparecen en la tabla de los mejores o peores nodos terminales. En general, las filas están en orden por el tamaño del error, bien sea MSE o MAD. Cuando ambos valores son menores que 1, los valores dentro de 1E-12 son empates. Cuando cualquiera de los valores de error es mayor que 1, los valores dentro de 1E-12* (valor más grande) son empates. Minitab ordena los empates por sus conteos ponderados. Si los conteos ponderados también son empates, Minitab ordena los empates por el ID de nodo.

Ajuste

El ajuste depende del criterio para la mejora de un nodo. Cuando el criterio es de mínimos cuadrados, entonces el ajuste es la media:

Cuando el criterio es la desviación absoluta mínima, entonces el ajuste es la mediana.

Desv.Est

MSE

MAD

EPAM

Notación

TérminoDescription
fitted value for the k-ésimo node
yi i -ésimo observed response value in the k-ésimo node
mean response for the records in the k-ésimo node
nkcount of records in the k-ésimo node
nk, tcount of records in the k-ésimo node for observations in either the training data set or the test data set
yi, t i -ésimo observed response value in the k-ésimo node for either the training data set or the test data set
mean response for the records in the k-ésimo node in either the training data set or the test data set
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política