Métodos y fórmulas para el porcentaje de estadísticas de error debido a los residuos más grandes en Regresión CART®

Seleccione el método o la fórmula de su elección.

Para el porcentaje de estadísticas de error, el valor depende del porcentaje de los residuos más grandes del cálculo. En las fórmulas siguientes, los cálculos suponen que los residuos están en orden por valor absoluto, de modo que i = 1 representa el residuo con el mayor valor absoluto y i = N representa el residuo con el menor valor absoluto.

Cuando se utiliza la validación cruzada de k pliegues, las estadísticas de entrenamiento incluyen los valores ajustados del árbol final para el conjunto de datos completo. Las estadísticas de prueba utilizan valores ajustados del proceso de validación que pueden tener árboles diferentes para cada pliegue.

Cuando se utiliza un conjunto de datos de prueba para la validación, las estadísticas de prueba utilizan valores ajustados solo para el conjunto de datos de prueba.

% MSE

% MAD

% EPAM

Notación

TérminoDescription
cmayor número de residuos para el porcentaje
yi i -ésimo valor de respuesta observado
respuesta media
i -ésimo respuesta ajustada
Nnúmero de registros