Una gráfica de caja proporciona un resumen gráfico de la distribución de cada muestra. La gráfica de caja permite comparar fácilmente la forma, tendencia central y variabilidad de las muestras.
Utilice una gráfica de caja para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de caja funcionan mejor cuando el tamaño de la muestra es mayor que 20.
Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Los datos asimétricos indican que los datos podrían no estar distribuidos normalmente. Frecuentemente, es más fácil detectar la asimetría con una gráfica de valores individuales, un histograma o una gráfica de caja.
Datos marcadamente asimétricos pueden afectar la validez del valor p si su muestra es pequeña (< 20 valores). Si sus datos son marcadamente asimétricos y tiene una muestra pequeña, considere aumentar el tamaño de la muestra.
Los valores atípicos, que son valores de datos que están muy alejados de otros valores de datos, pueden afectar fuertemente sus resultados. Frecuentemente, es más fácil identificar los valores atípicos en una gráfica de caja.
Intente identificar la causa de cualquier valor atípico. Corrija cualesquiera errores de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (causas especiales). A continuación, repita el análisis.
Una gráfica de valores individuales muestra los valores individuales en cada muestra. La gráfica de valores individuales facilita comparar las muestras. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando el tamaño de su muestra es pequeño.
Utilice una gráfica de valores individuales para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de valores individuales funcionan mejor cuando el tamaño de la muestra es menor que 50.
Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Los datos asimétricos indican que los datos podrían no estar distribuidos normalmente. Frecuentemente, es más fácil detectar la asimetría con una gráfica de valores individuales, un histograma o una gráfica de caja.
Los valores atípicos, que son valores de datos que están muy alejados de otros valores de datos, pueden afectar fuertemente sus resultados. Con frecuencia, los valores atípicos son más fáciles de identificar en una gráfica de valores individuales.
Intente identificar la causa de cualquier valor atípico. Corrija cualesquiera errores de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (causas especiales). A continuación, repita el análisis.
Use la gráfica de intervalo para mostrar la media y el intervalo de confianza para cada grupo.
Interprete cuidadosamente estos intervalos porque su tasa de error de tipo I aumenta cuando se hacen comparaciones múltiples. Es decir, mientras más comparaciones se hacen, mayor es la probabilidad de que al menos una comparación concluirá de forma incorrecta que una de las diferencias observadas es significativamente diferente.
En estos resultados, la Mezcla 2 tiene la media más baja y la Mezcla 4 tiene la mayor. Usted no puede determinar, con base en esta gráfica, si algunas de las diferencias son estadísticamente significativas. Para determinar la significancia estadística, evalúe los intervalos de confianza de las diferencias medias.