Consideraciones acerca de los datos para Gráfica marginal

A fin de que la gráfica represente sus datos de manera más efectiva, considere las siguientes directrices.

Los datos deben incluir uno par de columnas de datos numéricos o de fecha/hora
Las columnas deben tener el mismo número de filas.
El tamaño de la muestra debe ser de medio a grande
Debería considerar el tamaño de la muestra para la gráfica de dispersión y para el tipo de gráfica en los márgenes. Aunque no hay directrices formales sobre la cantidad de datos que se necesita para una gráfica de dispersión, las muestras más grandes indican patrones en los datos con mayor claridad. Los histogramas y las gráficas de caja funcionan mejor cuando el tamaño de la muestra es de por lo menos 20. Una gráfica de puntos funciona mejor cuando el tamaño de la muestra es aproximadamente menor que 50. Si el tamaño de la muestra es de 50 o mayor, un punto puede representar más de una observación.
Los datos de la muestra se deben seleccionar aleatoriamente
En estadística, las muestras aleatorias se utilizan para hacer generalizaciones, o inferencias, sobre una población. Si sus datos no se recopilaron aleatoriamente, sus resultados podrían no representar la población.