Diagrama de dispersión de ajustes de respuesta vs. valores reales para Ajustar modelo y Descubrir predictores clave con Regresión TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Utilice la gráfica de dispersión para evaluar la exactitud de las predicciones. Cuando el análisis utiliza una técnica de validación, también puede comparar la exactitud del árbol para los datos de entrenamiento y de prueba.

El diagrama de dispersión muestra los valores de respuesta reales en el eje X y los valores de respuesta ajustados en el eje Y. La línea calculada representa cuándo el valor real y el valor de respuesta son iguales. Los valores atípicos o los conglomerados de puntos inusuales en los datos de prueba pueden indicar que los datos ameritan más investigación.

Interpretación

Lo ideal es que la línea pase a través del centro de los puntos y que los puntos estén cerca de la línea en relación con la escala de la variable de respuesta. Cuando ha utilizado una técnica de validación, Minitab crea gráficas separadas para los datos de entrenamiento y de prueba. Puede comparar las gráficas para examinar el rendimiento relativo del árbol en los datos de entrenamiento y en nuevos datos. También puede buscar diferentes patrones que podrían indicar una diferencia por investigar entre los datos de entrenamiento y de prueba.

En esta gráfica de dispersión, los puntos de los conjuntos de datos de entrenamiento y de prueba muestran patrones similares. Esta similitud sugiere que el rendimiento del árbol en nuevos datos está cerca del rendimiento del árbol en los datos de entrenamiento.

La gráfica de dispersión de las cantidades ajustadas de los préstamos vs. las cantidades reales de los préstamos muestra la relación entre los valores ajustados y reales tanto para los datos de entrenamiento como para los datos de prueba. Puede pasar el cursor sobre los puntos de la gráfica para ver más fácilmente los valores graficados. En este ejemplo, todos los puntos se encuentran aproximadamente cerca de la línea de referencia de y=x.