Gráfica de caja de los residuos

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

Utilice la gráfica de caja de los residuos para evaluar la exactitud general del modelo. Cuando el análisis utiliza una técnica de validación, también puede comparar la exactitud del modelo para los datos de entrenamiento y prueba.

La gráfica de caja muestra la diferencia entre los valores reales y los valores ajustados. Los puntos que son más de 1.5 veces el rango intercuartil desde el cuartil más cercano tienen símbolos individuales.

Interpretación

Lo ideal es que los residuos estén todos cerca de 0 en relación con la escala de la variable de respuesta. Cuando se utiliza una técnica de validación, los resultados incluyen gráficos independientes para los datos de entrenamiento y prueba. Puede comparar las gráficas para examinar el rendimiento relativo del modelo con los datos de entrenamiento y con datos nuevos. También puede buscar diferentes patrones que podrían indicar una diferencia por investigar entre los datos de entrenamiento y de prueba.

Estas gráficas de caja muestran que el IQR es mucho mayor para el conjunto de datos de prueba que para el conjunto de datos de entrenamiento. Esta diferencia sugiere que el rendimiento del modelo con datos nuevos no es tan bueno como el rendimiento con los datos de entrenamiento. Además, los residuos grandes, que están representados por símbolos individuales, pueden indicar que el modelo no se ajusta bien a todos los datos.