Minitab proporciona un diagrama de Pareto de los efectos para visualizar los resultados de las tablas de coeficiente y ANOVA. Para los términos del modelo, esta gráfica le permite comparar la magnitud relativa de los efectos y evaluar su significancia estadística. Minitab dibuja el diagrama de Pareto cuando el modelo deja al menos 1 grado de libertad para el error.
El umbral de significancia estadística depende del nivel de significancia (denotado por α o alfa). A menos que usted utilice un método de selección escalonado, el nivel de significancia es 1 menos el nivel de confianza del análisis. Para obtener más información sobre cómo cambiar el nivel de confianza, vaya a Seleccione las opciones para Ajustar modelo de regresióny Regresión lineal. Si usa selección hacia atrás o selección escalonada, el nivel de significancia es el nivel de significancia en que Minitab elimina un término del modelo, conocido como Alfa a retirar. Si usa selección hacia adelante, el nivel de significancia es el nivel de significancia en que Minitab agrega un término al modelo, conocido como Alfa a entrar. Para obtener más información sobre las opciones de los métodos escalonados, vaya a Realice una regresión escalonada para Ajustar modelo de regresióny Regresión lineal.
Cuando utiliza la Selección hacia delante con validación como procedimiento escalonado, Minitab proporciona una gráfica de la estadística de R2 para el conjunto de datos de entrenamiento y la estadística de R2 de prueba o la estadística de R2 escalonado de k pliegues para cada paso del procedimiento de selección del modelo. La visualización de la estadística de R2 de prueba o la estadística de R2 escalonado de k pliegues depende de si se utiliza un conjunto de datos de prueba o una validación cruzada de k pliegues.
Utilice la gráfica para comparar los valores de las diferentes estadísticas de R2 en cada paso. Normalmente, el modelo funciona bien cuando las estadísticas de R2 son grandes. Minitab muestra las estadísticas de regresión para el modelo desde el paso que maximiza la estadística de R2 de prueba o la estadística de R2 de k pliegues. La gráfica muestra si los modelos más simples encajan lo suficientemente bien como para que también puedan ser buenos candidatos.
En un caso en el que el modelo tenga un ajuste excesivo, la estadística de R2 de prueba o la estadística de R2 escalonado de k pliegues comienza a disminuir a medida que los términos entran en el modelo. Esta disminución ocurre mientras que la estadística de R2 de entrenamiento correspondiente o la estadística de R2 para todos los datos continúa aumentando. Un modelo con ajuste excesivo se produce cuando se agregan términos para efectos que no son importantes en la población. Un modelo con ajuste excesivo puede no ser útil para hacer predicciones sobre la población. Si un modelo tiene ajuste excesivo, puede considerar los modelos de pasos anteriores.
En la siguiente gráfica se muestra el R2 de prueba como ejemplo. Inicialmente, las estadísticas de R2 están cerca de 70%. Para los primeros pasos, las estadísticas de R2 tienden a aumentar a medida que los términos entran en el modelo. En el paso 6, la estadística de R2 de prueba es de aproximadamente 88%. El valor máximo de la estadística de R2 de prueba está en el paso 14 y tiene un valor cercano a 90%. Puede considerar si la mejora del ajuste justifica la complejidad adicional al agregar más términos al modelo.
Después del paso 14, mientras que el R2 continúa aumentando, el R2 de prueba no. La disminución en la prueba de R2 después del paso 14 indica que el modelo tiene un ajuste excesivo.