Una recopilación de datos se puede distribuir o dispersar de muchas maneras diferentes. Por ejemplo, los datos que se obtienen al lanzar un dado pueden tener valores enteros aleatorios de 1 a 6. Los datos de un proceso de manufactura pueden estar centrados en un valor objetivo o pueden incluir valores de datos que están muy alejados del valor central.
Usted puede evaluar una distribución de datos por medio de gráficas, estadísticos descriptivos o comparación con una distribución teórica:
- Gráficas
- Las gráficas, al igual que los histogramas, pueden proveer instantáneamente información sobre la distribución de un conjunto de datos. Los histogramas pueden ayudarle a observar:
- Si los datos se agrupan en torno a un valor individual o si los datos tienen múltiples picos o modas.
- Si los datos están diseminados con poca densidad en un rango amplio o si los datos se encuentran dentro de un rango pequeño.
- Si los datos son asimétricos o simétricos.
- Estadísticos descriptivos
- Los estadísticos descriptivos que describen la tendencia central (media, mediana) y la dispersión (varianza, desviación estándar) de los datos con valores numéricos agregan un nivel de detalle y se pueden utilizar para hacer comparaciones con otros conjuntos de datos.
- Distribuciones teóricas
- Finalmente, se pueden identificar algunas distribuciones comunes y nos referimos a ellas por su nombre, como distribución normal, de Weibull y exponencial. La distribución normal, por ejemplo, siempre tiene forma de campana y es simétrica respecto a un valor medio.
- Los datos reales probablemente solo se aproximarán a estas distribuciones perfectas. Si hay un ajuste cercano, puede decir que los datos son modelados adecuadamente por una distribución dada. Utilice para identificar la distribución que mejor se ajuste a los datos.