Examine los pico y la dispersión de la distribución. Evalúa cómo el tamaño de la muestra puede afectar la apariencia del histograma.
Identifique los picos, que son los conglomerados más altos de las barras. Los picos representan los valores más comunes. Evalúe la dispersión de su muestra para entender qué tanto varían sus datos.
Investigue cualquier característica sorpresiva o no deseada en el histograma. Por ejemplo, el histograma de tiempos de espera de los clientes mostró una dispersión mayor que la esperada. Una investigación reveló que una actualización del software en las computadoras causó los retrasos en los tiempos de espera.
El tamaño de la muestra puede afectar la apariencia de la gráfica.
Un histograma funciona mejor cuando el tamaño de la muestra es al menos de 20. Si el tamaño de la muestra es demasiado pequeño, es posible que cada barra en el histograma no contenga suficientes puntos de datos para mostrar exactamente la distribución de los datos. Mientras más grande es la muestra, mayor será la semejanza del histograma a la forma de la distribución de población. Si el tamaño de la muestra es menor que 20, considere usar en su lugar una gráfica de valores individuales.
Los datos asimétricos y los datos multimodales indican que los datos podrían ser no normales. Los valores atípicos pueden indicar otras condiciones en sus datos.
Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. La asimetría indica que los datos pueden no estar distribuidos normalmente.
Estos histogramas ilustran los datos asimétricos. El histograma con datos asimétricos hacia la derecha muestra tiempos de espera. La mayoría de los tiempos de espera son relativamente cortos y solo unos pocos tiempos de espera son largos. El histograma con datos asimétricos hacia la izquierda muestra datos de tiempo de falla. Unos pocos elementos fallan inmediatamente y muchos más fallan posteriormente.
Si usted está en conocimiento de que sus datos no son naturalemente asimétricos, investigue las posibles causas. Si desea analizar los datos marcadamente asimétricos, lea el tema Consideraciones acerca de los datos para el análisis a fin de asegurarse de que pueda utilizar los datos que no sean normales.
Los valores atípicos, que son valores de datos que están muy alejados de otros valores de datos, pueden afectar fuertemente sus resultados. Frecuentemente, es más fácil identificar los valores atípicos en una gráfica de caja.
Intente identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). A continuación, repita el análisis.
Los datos multimodales tienen más de un pico. (Un pico representa el modo de un conjunto de datos). Los datos multimodales generalmente ocurren cuando los datos se recopilan a partir de más de un proceso o condición, como por ejemplo en más de una temperatura.
Por ejemplo, estos histogramas son gráficas de los mismos datos. El histograma simple tiene dos picos, pero no está claro que significan los picos. El histograma con grupos muestra los picos correspondientes a dos grupos.
Si usted tiene información adicional que le permita clasificar las observaciones en grupos, puede crear una variable de grupo con esta información. Luego, puede crear la gráfica con grupos para determinar si la variable de grupo representa los picos en los datos.
Para agregar una variable de grupo a una gráfica existente, haga doble clic en una representación de datos de la gráfica y luego haga clic en la ficha Grupos.
Si su histograma tiene una línea de distribución ajustada, evalúe que tan cerca siguen las alturas de las barras la forma de la línea. Si las barras siguen de cerca la línea de distribución ajustada, entonces los datos se ajustan adecuadamente a la distribución.
Para información sobre cómo especificar diferentes distribuciones y parámetros, vaya a Líneas de distribución ajustadas.
Para una medición más precisa del ajuste de distribución, utilice una gráfica de probabilidad para revisar el ajuste de la significancia estadística.
Si su histograma tiene grupos, evalúe y compare el centro y la dispersión de los grupos.
Buscar diferencias entre los centros de los grupos.
Buscar diferencias entre las dispersiones de los grupos.