Determine que relação de modelo ajusta melhor os seus dados e avalie a força da relação.
Neste exemplo, o Minitab agrupa os dados em caixas retangulares. Minitab usa de cinza claro a azul escuro para as caixas com base no número de observações que estão na caixa. O economista vê que muitas pessoas têm uma relação de dívida próxima de 0, independentemente da idade, e muito poucas pessoas têm uma relação de dívida próxima de 1. A região mais escura no meio do gráfico mostra que a relação de dívida aumenta à medida que aumenta a idade. No entanto, quando a idade está em torno de 50, a região mais escura faz uma curva para baixo e começa a diminuir com a idade. A idade e a relação de dívidas parecem ter uma relação quadrática. O economista decide que um modelo de regressão para a relação de dívidas deve incluir um termo de segunda ordem para a idade.
Se você incluir uma terceira variável, procure uma relação entre essa variável e as variáveis x e y. O Minitab colore as caixas com base no valor médio da terceira variável para todas as observações naquela caixa. Se não houver relação, a cor das caixas será espalhada aleatoriamente por todo o gráfico de dispersão em caixas. Um padrão nas cores indica que pode existir uma relação.
Neste exemplo, a equipe de pesquisa quer determinar como o quilate e a cor afetam o preço dos diamantes. O Minitab usa de azul escuro até vermelho escuro para as caixas com base na cor do diamante. Tons mais escuros de vermelho correspondem a valores mais elevados da variável de cor. Tons mais escuros de azul correspondem a valores mais baixos da variável de cor. O preço aumenta conforme a aumentam os quilates. No entanto, ainda há uma grande variação nos preços dos diamantes com o mesmo número de quilates. A cor do diamante explica um pouco dessa variação. Para diamantes com número semelhante de quilates, um número de cor mais alto corresponde a um preço mais alto.
A cor de um diamante é representada por uma letra. Como todas as variáveis devem ser numéricas, os pesquisadores codificam a cor do diamante para uma escala numérica que v0aria de 0 a 6. O empresário dá aos diamantes incolores um número maior e dá aos diamantes amarelos claros um número menor.
Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem indicar condições incomuns em seus dados e afetar fortemente seus resultados.
Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.