Determinar cuál es la relación de modelo que mejor se ajusta a sus datos y evaluar la fuerza de la relación.
En este ejemplo, Minitab agrupa los datos en secciones rectangulares. Minitab utiliza gris claro a azul oscuro para las secciones en función del número de observaciones que se encuentran en la sección. El economista ve que muchas personas tienen una relación de deuda cercana a 0 independientemente de la edad, y muy pocas personas tienen una relación de deuda cercana a 1. La región más oscura en el centro de la gráfica muestra que la relación de deuda aumenta a medida que aumenta la edad. Sin embargo, cuando la edad es aproximadamente 50, la región más oscura se curva hacia abajo y comienza a disminuir con la edad. La edad y la relación de deuda parecen tener una relación cuadrática. El economista decide que un modelo de regresión para la relación de deuda debe incluir un segundo término para la edad.
Si incluye una tercera variable, busque una relación entre esa variable y la variable X y la variable Y. Minitab colorea las secciones en función del valor promedio de la tercera variable para todas las observaciones en esa sección. Si no hay ninguna relación, el color de las secciones se dispersará aleatoriamente por toda la gráfica de dispersión dividida en clases. Un patrón en los colores indica que puede existir una relación.
En este ejemplo, el equipo de investigación desea determinar cómo los quilates y el color afectan el precio de los diamantes. Minitab utiliza azul oscuro a rojo oscuro para las secciones basadas en el color del diamante. Los tonos más oscuros de rojo corresponden a valores más altos de la variable de color. Los tonos más oscuros de azul corresponden a valores más bajos de la variable de color. El precio aumenta a medida que aumenta el número de quilates. Sin embargo, todavía hay una gran variación en los precios de los diamantes con el mismo número de quilates. El color del diamante explica parte de esta variación. Para los diamantes con un número similar de quilates, un número de color más alto corresponde a un precio más alto.
El color de un diamante se representa con una letra. Puesto que todas las variables deben ser numéricas, los investigadores codifican el color del diamante con una escala numérica que varía de 0 a 6. El propietario les da a los diamantes incoloros un número más alto y da a los diamantes amarillo claro un número menor.
Los valores atípicos, que son valores de datos que se encuentran alejados de otros valores de datos, pueden indicar condiciones poco comunes en sus datos y afectar sustancialmente los resultados.
Intente identificar la causa de cualesquiera valores atípicos. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). Luego, repita el análisis.