Ejemplo de Descubrir predictores clave para Regresión TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información acerca de cómo activar el módulo.

Un equipo de investigadores quiere utilizar datos de un proceso de moldeo por inyección para estudiar la configuración requerida para las máquinas con el fin de maximizar un tipo de resistencia de una pieza de plástico. Las variables incluyen controles en las máquinas, diferentes fórmulas de plástico y las máquinas de moldeo por inyección.

Como parte de la exploración inicial de los datos, el equipo decide utilizar Descubrir predictores clave para comparar los modelos eliminando en secuencia los predictores no importantes para identificar predictores clave. Los investigadores esperan identificar predictores clave que tengan más efecto en la respuesta y obtener más información sobre las relaciones entre la respuesta y los predictores clave.

  1. Abra el conjunto de datos de muestra proceso_de_inyección.MTW.
  2. Elija Módulo de análisis predictivo > Regresión TreeNet® > Descubrir predictores clave.
  3. En Respuesta, ingrese fuerza.
  4. En Predictores continuos, ingrese presión de inyeccióntemperatura a medida.
  5. En Predictores categóricos, ingrese máquinafórmula.
  6. Haga clic en Aceptar.

Interpretar los resultados

Para este análisis, Minitab Statistical Software compara 20 modelos. El asterisco de la columna Modelo de la tabla Evaluación del modelo muestra que el modelo con el mayor valor de la estadística de R2 con validación cruzada es el modelo 16. El modelo 16 contiene 5 predictores importantes. Los resultados que siguen a la tabla de evaluación del modelo son para el modelo 16.

Aunque el modelo 16 tiene el mayor valor de la estadística de R2 con validación cruzada, otros modelos tienen valores similares. El equipo puede hacer clic en Seleccione un modelo alternativo para generar resultados para otros modelos de la tabla Evaluación de modelos.

En los resultados del Modelo 16, la gráfica de R cuadrada vs. número de árboles muestra que el número óptimo de árboles es igual al número de árboles del análisis, 300. El equipo puede hacer clic en Ajustar hiperparámetros para identificar un mejor modelo para aumentar el número de árboles y ver si los cambios en otros hiperparámetros mejoran el rendimiento del modelo.

La gráfica Importancia relativa de las variables presenta los predictores en el orden de su efecto en la mejora del modelo cuando se realizan divisiones en un predictor sobre la secuencia de árboles. La variable predictora más importante es Temperatura del molde. Si la importancia de la variable predictora más importante, Temperatura del molde, es del 100%, entonces la siguiente variable importante, Máquina, tiene una contribución del 58.7%. Esto significa que la máquina que inyecta es 58.7% tan importante como la temperatura al interior del molde.

Utilice las gráficas de dependencia parcial para obtener información sobre cómo las variables o pares de variables importantes afectan la respuesta pronosticada. Los valores de respuesta en la escala de 1/2 logaritmo son las predicciones a partir del modelo. Las gráficas de dependencia parcial muestran si la relación entre la respuesta y una variable es lineal, monótona o más compleja.

Las gráficas de dependencia parcial de un predictor muestran que la temperatura del molde, la presión de la inyección y la temperatura de enfriamiento tienen una relación positiva con la resistencia. La gráfica de las máquinas muestra las diferencias entre máquinas, donde la máquina 1 fabrica las piezas más débiles en promedio y la máquina 4 fabrica las piezas más resistentes en promedio. El equipo observa que la temperatura del molde y la máquina tienen la interacción más fuerte en los datos, por lo que observan la gráfica de dependencia parcial de dos predictores para comprender aún más cómo estas variables afectan la resistencia. El equipo puede hacer clic en Seleccionar más predictores para graficar para crear gráficas para otras variables, como Temperatura de inyección.

La gráfica de dependencia parcial de dos predictores de la temperatura del molde y la máquina proveen una idea de la diferencia en la resistencia promedio de las máquinas. Una razón es que los datos de la máquina 1 no incluyen tantas observaciones a las temperaturas más altas del molde como las otras máquinas. El equipo aún podría decidir buscar otras razones por las que las máquinas producen diferentes resistencias cuando otras configuraciones son las mismas. El equipo puede hacer clic en Seleccionar más predictores para graficar para crear gráficas para otros pares de variables.

Regresión TreeNet®: fuerza vs presión de i, temperatura , Temperatura , ...

Método Función de pérdida Error cuadrático Criterio para seleccionar un número óptimo de árboles R-cuadrado máximo Validación del modelo Validación cruzada de 3 pliegues Tasa de aprendizaje 0.01408 Fracción de submuestra 0.5 Máximo de nodos terminales por árbol 6 Tamaño mínimo del nodo terminal 3 Número de predictores seleccionados para la división de nodos Número total de predictores = 21 Filas utilizadas 1408
Información de respuesta Media Desv.Est. Mínimo Q1 Mediana Q3 Máximo 485.247 318.611 41.2082 301.099 398.924 562.449 2569.04

Regresión TreeNet® - Descubrir los predictores clave: fuerza vs. presión de i, temperatura , ...

Gráfica de eliminación de predictores

Selección del modelo eliminando predictores no importantes Prueba Número óptimo de R-cuadrado Número de Modelo árboles (%) predictores 1 300 89.32 21 2 300 89.34 19 3 300 89.39 18 4 300 89.46 17 5 300 89.51 16 6 300 89.50 15 7 300 89.59 14 8 300 89.57 13 9 300 89.69 12 10 300 89.70 11 11 300 89.86 10 12 300 89.90 9 13 300 89.92 8 14 300 90.06 7 15 300 90.16 6 16* 300 90.23 5 17 300 89.96 4 18 297 79.37 3 19 244 66.64 2 20 164 46.19 1
Modelo Predictores eliminados 1 Ninguno 2 caudal de plástico, cambiar de posición 3 Temperatura de secado 4 zona de temperatura de fusión 2 5 Temperatura de plástico 6 fórmula 7 presión de retención 8 cojín de tornillo 9 zona de temperatura de fusión 4 10 presión de espalda 11 zona de temperatura de fusión 1 12 Tiempo de secado 13 temperatura a medida 14 zona de temperatura de fusión 5 15 zona de temperatura de fusión 3 16* Velocidad de rotación tornillo 17 temperatura de inyección 18 Temperatura de refrigeración 19 presión de inyección 20 máquina El algoritmo eliminó un solo predictor y todos los predictores con 0 importancia en cada paso. * El modelo seleccionado tiene el R-cuadrado máximo. A continuación se muestra la salida del modelo seleccionado.

Gráficas de dependencia parcial de un predictor

Seleccionar más predictores para graficar...

Dos gráficas de dependencia parcial predictora

Seleccionar más predictores para graficar...

Regresión TreeNet®: fuerza vs presión de i, temperatura , Temperatura , ...

Resumen del modelo Total de predictores 5 Predictores importantes 5 Número de árboles cultivados 300 Número óptimo de árboles 300 Estadísticas Entrenamiento Prueba R-cuadrado 92.23% 90.23% Raíz de los cuadrados medios del error (RMSE) 88.8049 99.5673 Cuadrado medio del error (MSE) 7886.3152 9913.6420 Desviación absoluta media (MAD) 68.9231 74.4113 Media del error porcentual absoluto (MAPE) 0.2083 0.2175