Interpretar os principais resultados para Gráfico de dispersão marginal.

Conclua as etapas a seguir para interpretar um gráfico de dispersão marginal.

Passo 1: Procure por uma relação de modelo e avalie sua força

Determine que relação de modelo ajusta melhor os seus dados e avalie a força da relação.

Dica

Para visualizar melhor o quão bem um determinado ajuste de modelo adapta seus dados, crie um gráfico de dispersão com uma linha de regressão ajustada.

Tipo de relação

Determine que relação de modelo, se houver, ajusta melhor seus dados. Apresentamos a seguir exemplos dos tipos de relacionamentos.
Linear: positivo
Linear: negativo
Curvado: quadrático
Curvado: cúbico
Nenhuma relação

Se seus dados parecerem se ajustar a um modelo, você pode explorar a relação usando uma análise de regressão.

Força da relação

Avalie o quão próximos os dados se encaixam no modelo para estimar a força da relação entre X e Y. Quando a relação for forte, a equação de regressão modelará os dados com precisão.
Relação mais fraca
Relação mais forte

Para quantificar a força de uma relação linear (reta), use uma análise de correlação.

Etapa 2: Procure por indicadores de dados incomuns ou anormais

Dados assimétricos e dados multimodais indicam que os dados podem ser anormais. Os Outliers podem indicar outras condições em seus dados.

Dados assimétricos

Quando os dados são assimétricos, a maior parte dos dados está localizada no lado superior ou inferior do gráfico. A assimetria indica que os dados podem não ser normalmente distribuídos. Em um gráfico de dispersão marginal, observe os gráficos nas margens quanto a indicadores de dados assimétricos.

Por exemplo, os gráficos a seguir com dados assimétricos à direita mostram os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. Os gráficos a seguir com dados assimétricos à esquerda mostram dados de tempos de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.
Histogramas
Assimétricos à direita
Assimétricos à esquerda
Diagramas de pontos
Assimétricos à direita
Assimétricos à esquerda
Boxplots
Assimétricos à direita
Assimétricos à esquerda

Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se você desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.

Outliers

Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados. Em um gráfico de dispersão marginal, observe o gráfico de dispersão e os gráficos nas margens quanto a outliers.

Gráfico de dispersão
Em um gráfico de dispersão, pontos isolados identificam os outliers.
Histograma
Em um histograma, as barras isoladas nas extremidades identificam os outliers.
Diagrama de pontos
Em um diagrama de pontos, valores de dados incomuns altos ou baixos identificam possíveis outliers.
Boxplot
Em um boxplot, os outliers são identificados por asteriscos (*).

Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.

Dados multimodais

Dados multimodais têm mais do que um pico. (Um pico representa o modo de um ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são coletados a partir de mais de um processo ou condição, como mais do que uma temperatura.

Em um gráfico de dispersão marginal, observe os os histogramas ou diagramas de pontos nas margens quanto a indicadores de dados multimodais. Por exemplo, estes gráficos têm dois picos.
Histograma
Diagrama de pontos

Se você tiver informações adicionais que permitem a classificação das observações em grupos, poderá criar uma variável de grupo com estas informações. Depois, você poderá criar o um histograma ou ou diagrama de pontos com grupos para determinar se a variável de grupo contabiliza os picos nos dados.