Determine que relação de modelo ajusta melhor os seus dados e avalie a força da relação.
Para visualizar melhor o quão bem um determinado ajuste de modelo adapta seus dados, crie um gráfico de dispersão com uma linha de regressão ajustada.
Se seus dados parecerem se ajustar a um modelo, você pode explorar a relação usando uma análise de regressão.
Para quantificar a força de uma relação linear (reta), use uma análise de correlação.
Dados assimétricos e dados multimodais indicam que os dados podem ser anormais. Os Outliers podem indicar outras condições em seus dados.
Quando os dados são assimétricos, a maior parte dos dados está localizada no lado superior ou inferior do gráfico. A assimetria indica que os dados podem não ser normalmente distribuídos. Em um gráfico de dispersão marginal, observe os gráficos nas margens quanto a indicadores de dados assimétricos.
Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se você desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.
Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados. Em um gráfico de dispersão marginal, observe o gráfico de dispersão e os gráficos nas margens quanto a outliers.
Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.
Dados multimodais têm mais do que um pico. (Um pico representa o modo de um ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são coletados a partir de mais de um processo ou condição, como mais do que uma temperatura.
Se você tiver informações adicionais que permitem a classificação das observações em grupos, poderá criar uma variável de grupo com estas informações. Depois, você poderá criar o um histograma ou ou diagrama de pontos com grupos para determinar se a variável de grupo contabiliza os picos nos dados.