La gráfica de caja muestra la diferencia entre los valores reales y los valores ajustados. Los puntos que son más de 1.5 veces el rango intercuartil desde el cuartil más cercano tienen símbolos individuales.
Lo ideal es que los residuos estén todos cerca de 0 en relación con la escala de la variable de respuesta. Cuando utiliza una técnica de validación, Minitab crea gráficas separadas para los datos de entrenamiento y de prueba. Puede comparar las gráficas para examinar el rendimiento relativo del árbol en los datos de entrenamiento y en nuevos datos. También puede buscar diferentes patrones que podrían indicar una diferencia por investigar entre los datos de entrenamiento y de prueba.
Estas gráficas de caja muestran resultados similares para los conjuntos de datos de entrenamiento y de prueba. Esta similitud sugiere que el rendimiento del árbol en nuevos datos está cerca del rendimiento del árbol en los datos de entrenamiento.
El rango intercuartil de las gráficas de caja para ambos conjuntos de datos es de aproximadamente –2.6 a 2.6. El 50% de los datos tienen residuos dentro de este rango. Los residuos restantes son más grandes. Debido a que el rango intercuartil es de aproximadamente 5, los residuos que están fuera del rango aproximado de –10.5 a 10.5 tienen símbolos individuales. Los residuos más grandes están cerca de 20 en las direcciones positiva y negativa. Estos residuos grandes pueden indicar que el árbol no ajusta bien todos los datos.