Considerações de dados para Gráfico de dispersão marginal

Para o gráfico representar seus dados de forma mais eficaz, considere as seguintes diretrizes.

Os dados devem incluir par de colunas de dados no formato data/hora ou numérico.
As colunas devem ter o mesmo número de linhas.
O tamanho amostral deve ser de médio para grande
Você deve considerar o tamanho amostral para o gráfico de dispersão e para o tipo de gráfico nas margens. Apesar de não ter diretrizes formais para a quantidade de dados necessários para um gráfico de dispersão, as amostras maiores indicam de forma mais clara os padrões nos dados. Os histogramas e os boxplots funcionam melhor quando o tamanho amostral tem pelo menos 20. Um diagrama de pontos é melhor quando o tamanho amostral for menor do que aproximadamente 50. Se o tamanho da amostra é de 50 ou superior, um ponto pode representar mais do que uma observação.
Os dados de amostra devem ser selecionados aleatoriamente
Nas estatísticas, as amostras aleatórias são usadas para fazer generalizações ou inferências, sobre uma população. Se os dados não foram coletados aleatoriamente, os resultados podem não representar a população.