Interpretar los resultados clave para Histograma

Complete los siguientes pasos para interpretar un histograma.

Paso 1: Evaluar las características clave

Examine los pico y la dispersión de la distribución. Evalúa cómo el tamaño de la muestra puede afectar la apariencia del histograma.

Picos y dispersión

Identifique los picos, que son los conglomerados más altos de las barras. Los picos representan los valores más comunes. Evalúe la dispersión de su muestra para entender qué tanto varían sus datos.

Por ejemplo, es este histograma de tiempos de espera de los clientes, el pico de los datos ocurre en torno a los 6 minutos. La dispersión de datos es desde casi los 2 hasta los 12 minutos.

Investigue cualquier característica sorpresiva o no deseada en el histograma. Por ejemplo, el histograma de tiempos de espera de los clientes mostró una dispersión mayor que la esperada. Una investigación reveló que una actualización del software en las computadoras causó los retrasos en los tiempos de espera.

Tamaño de la muestra (n)

El tamaño de la muestra puede afectar la apariencia de la gráfica.

Por ejemplo, aunque estos histogramas parecen ser muy diferentes, ambos se crearon utilizando muestras seleccionadas aleatoriamente a partir de la misma población.
n = 20
n = 100

Un histograma funciona mejor cuando el tamaño de la muestra es al menos de 20. Si el tamaño de la muestra es demasiado pequeño, es posible que cada barra en el histograma no contenga suficientes puntos de datos para mostrar exactamente la distribución de los datos. Mientras más grande es la muestra, mayor será la semejanza del histograma a la forma de la distribución de población. Si el tamaño de la muestra es menor que 20, considere usar en su lugar una gráfica de valores individuales.

Paso 2: Buscar indicadores de datos inusuales o no normales

Los datos asimétricos y los datos multimodales indican que los datos podrían ser no normales. Los valores atípicos pueden indicar otras condiciones en sus datos.

Datos asimétricos

Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. La asimetría indica que los datos pueden no estar distribuidos normalmente.

Estos histogramas ilustran los datos asimétricos. El histograma con datos asimétricos hacia la derecha muestra tiempos de espera. La mayoría de los tiempos de espera son relativamente cortos y solo unos pocos tiempos de espera son largos. El histograma con datos asimétricos hacia la izquierda muestra datos de tiempo de falla. Unos pocos elementos fallan inmediatamente y muchos más fallan posteriormente.

Asimétrico hacia la derecha
Asimétrico hacia la izquierda

Si usted está en conocimiento de que sus datos no son naturalemente asimétricos, investigue las posibles causas. Si desea analizar los datos marcadamente asimétricos, lea el tema Consideraciones acerca de los datos para el análisis a fin de asegurarse de que pueda utilizar los datos que no sean normales.

Valores atípicos

Los valores atípicos, que son valores de datos que están muy alejados de otros valores de datos, pueden afectar fuertemente sus resultados. Frecuentemente, es más fácil identificar los valores atípicos en una gráfica de caja.

En un histograma, las barras aisladas en los extremos identifican los valores atípicos.

Intente identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). A continuación, repita el análisis.

Datos multimodales

Los datos multimodales tienen más de un pico. (Un pico representa el modo de un conjunto de datos). Los datos multimodales generalmente ocurren cuando los datos se recopilan a partir de más de un proceso o condición, como por ejemplo en más de una temperatura.

Por ejemplo, estos histogramas son gráficas de los mismos datos. El histograma simple tiene dos picos, pero no está claro que significan los picos. El histograma con grupos muestra los picos correspondientes a dos grupos.

Simple
Con grupos

Si usted tiene información adicional que le permita clasificar las observaciones en grupos, puede crear una variable de grupo con esta información. Luego, puede crear la gráfica con grupos para determinar si la variable de grupo representa los picos en los datos.

Sugerencia

Para agregar una variable de grupo a una gráfica existente, haga doble clic en una representación de datos de la gráfica y luego haga clic en la ficha Grupos.

Paso 3: Evaluar el ajuste de una distribución

Si su histograma tiene una línea de distribución ajustada, evalúe que tan cerca siguen las alturas de las barras la forma de la línea. Si las barras siguen de cerca la línea de distribución ajustada, entonces los datos se ajustan adecuadamente a la distribución.

Nota

Para información sobre cómo especificar diferentes distribuciones y parámetros, vaya a Líneas de distribución ajustadas.

Ajuste adecuado
Ajuste deficiente

Para una medición más precisa del ajuste de distribución, utilice una gráfica de probabilidad para revisar el ajuste de la significancia estadística.

Paso 4: Evaluar y comparar los grupos

Si su histograma tiene grupos, evalúe y compare el centro y la dispersión de los grupos.

Centros

Buscar diferencias entre los centros de los grupos.

Por ejemplo, estos histogramas muestran el tiempo de culminación de tres versiones de solicitud de tarjetas de crédito. El centro de cada versión de solicitud de tarjetas de crédito se encuentra en una ubicación diferente. Las diferencias en las ubicaciones indican que la media de tiempos de culminación son diferentes.
Histogramas superpuestos
Histogramas divididos en paneles
Para determinar si una diferencia en medias es estadísticamente significativa, realice uno de los siguientes procedimientos:

Dispersiones

Buscar diferencias entre las dispersiones de los grupos.

Por ejemplo, estos histogramas muestran los pesos de jarras llenadas por tres máquinas. Aunque los histogramas tienen casi el mismo centro, algunos histogramas son más amplios y más dispersos. La dispersión más amplia indica que aquellas máquinas llenan las jarras de manera menos consistente.
Histogramas superpuestos
Histogramas divididos en paneles
Para determinar si una diferencia en la dispersión (varianza) es estadísticamente significativa, realice uno de los siguientes procedimientos: