Interprete os principais resultados para Gráfico de dispersão em caixas

Percorra os passos a seguir para interpretar um gráfico de dispersão em caixas.

Passo 1: Procure por padrões em seus dados

Determine que relação de modelo ajusta melhor os seus dados e avalie a força da relação.

Tipo de relação

Embora você não possa adicionar uma linha de ajuste de regressão para Gráfico de dispersão em caixas, pode procurar os seguintes padrões em seus dados. Se você vir um padrão, pode usar Estat > Regressão > Regressão > Ajuste do modelo de regressão para criar um modelo.
Linear: positivo
Linear: negativo
Curvado: quadrático
Curvado: cúbico
Nenhuma relação

Neste exemplo, o Minitab agrupa os dados em caixas retangulares. Minitab usa de cinza claro a azul escuro para as caixas com base no número de observações que estão na caixa. O economista vê que muitas pessoas têm uma relação de dívida próxima de 0, independentemente da idade, e muito poucas pessoas têm uma relação de dívida próxima de 1. A região mais escura no meio do gráfico mostra que a relação de dívida aumenta à medida que aumenta a idade. No entanto, quando a idade está em torno de 50, a região mais escura faz uma curva para baixo e começa a diminuir com a idade. A idade e a relação de dívidas parecem ter uma relação quadrática. O economista decide que um modelo de regressão para a relação de dívidas deve incluir um termo de segunda ordem para a idade.

Passo 2: Procure por padrões com uma terceira variável

Se você incluir uma terceira variável, procure uma relação entre essa variável e as variáveis x e y. O Minitab colore as caixas com base no valor médio da terceira variável para todas as observações naquela caixa. Se não houver relação, a cor das caixas será espalhada aleatoriamente por todo o gráfico de dispersão em caixas. Um padrão nas cores indica que pode existir uma relação.

Neste exemplo, a equipe de pesquisa quer determinar como o quilate e a cor afetam o preço dos diamantes. O Minitab usa de azul escuro até vermelho escuro para as caixas com base na cor do diamante. Tons mais escuros de vermelho correspondem a valores mais elevados da variável de cor. Tons mais escuros de azul correspondem a valores mais baixos da variável de cor. O preço aumenta conforme a aumentam os quilates. No entanto, ainda há uma grande variação nos preços dos diamantes com o mesmo número de quilates. A cor do diamante explica um pouco dessa variação. Para diamantes com número semelhante de quilates, um número de cor mais alto corresponde a um preço mais alto.

Observação

A cor de um diamante é representada por uma letra. Como todas as variáveis devem ser numéricas, os pesquisadores codificam a cor do diamante para uma escala numérica que v0aria de 0 a 6. O empresário dá aos diamantes incolores um número maior e dá aos diamantes amarelos claros um número menor.

Passo 3: Procure por outliers

Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem indicar condições incomuns em seus dados e afetar fortemente seus resultados.

Em um gráfico de dispersão em caixas, caixas isoladas podem identificar os outliers.

Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.