Para el porcentaje de estadísticas de error, el valor depende del porcentaje de los residuos más grandes del cálculo. En las fórmulas siguientes, los cálculos suponen que los residuos están en orden por valor absoluto, de modo que i = 1 representa el residuo con el mayor valor absoluto y i = N representa el residuo con el menor valor absoluto.
Cuando se utiliza la validación cruzada de k pliegues, las estadísticas de entrenamiento incluyen los valores ajustados del árbol final para el conjunto de datos completo. Las estadísticas de prueba utilizan valores ajustados del proceso de validación que pueden tener árboles diferentes para cada pliegue.
Cuando se utiliza un conjunto de datos de prueba para la validación, las estadísticas de prueba utilizan valores ajustados solo para el conjunto de datos de prueba.
Término | Description |
---|---|
c | mayor número de residuos para el porcentaje |
yi | i -ésimo valor de respuesta observado |
respuesta media | |
i -ésimo respuesta ajustada | |
N | número de registros |