Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.
La gráfica de caja muestra la diferencia entre los valores reales y los valores ajustados. Los puntos que son más de 1.5 veces el rango intercuartil desde el cuartil más cercano tienen símbolos individuales.
Lo ideal es que los residuos estén todos cerca de 0 en relación con la escala de la variable de respuesta. Cuando el análisis utiliza un método de validación, los resultados incluyen gráficos separados para los datos de entrenamiento y para los resultados de validación. El rendimiento del árbol a partir de los resultados de validación suele ser una mejor representación de cómo funciona el árbol para nuevos datos. Deberías investigar grandes diferencias entre los resultados de validación y los datos de entrenamiento.
Estas gráficas de caja muestran que el IQR es mucho mayor para el conjunto de datos de prueba que para el conjunto de datos de entrenamiento. Esta diferencia sugiere que el rendimiento del modelo con datos nuevos no es tan bueno como el rendimiento con los datos de entrenamiento. Además, los residuos grandes, que están representados por símbolos individuales, pueden indicar que el modelo no se ajusta bien a todos los datos.