Examine el centro y la dispersión de la distribución. Evalúe cómo el tamaño de la muestra puede afectar la apariencia de la gráfica de tallo y hoja.
Para cada fila, el número en el "tallo" (la columna intermedia) representa el primer dígito (o dígitos) de los valores de muestra. La "unidad de la hoja" en la parte superior de la gráfica indica qué lugar decimal representan los valores de la hoja.
Investigue cualquier característica sorpresiva o no deseada. Por ejemplo, la gráfica de tallo y hoja de tiempos de espera de los clientes mostró valores más añtos y una dispersión más grande de lo esperado. Una investigación reveló que un tráfico web inusualmente pesado causó inestabilidad y retrasos.
El tamaño de la muestra puede afectar la apariencia de la gráfica.
El tamaño de la muestra se muestra en la parte superior de la gráfica de tallo y hoja. En el ejemplo previo, el tamaño de la muestra es de 50 (N = 50)
Dado que una gráfica de tallo y hoja representa cada valor de dato, es mejor cuando el tamaño de la muestra es menor que 50 aproximadamente. Si la muestra es mayor que 50, los puntos de datos en la gráfica se pueden extender demasiado lejos, y la distribución puede ser difícil de evaluar. Si tiene más de 50 puntos de datos, considere la posibilidad de utilizar una gráfica de caja o un histograma.
Los datos asimétricos y los datos multimodales indican que los datos podrían ser no normales. Los valores atípicos pueden indicar otras condiciones en sus datos.
Determinar si los datos son asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. La asimetría indica que los datos pueden no estar distribuidos normalmente. Frecuentemente, es más fácil detectar la asimetría con un histograma o una gráfica de caja.
Estas gráficas de tallo y hoja ilustran los datos asimétricos. La gráfica de tallo y hoja con datos asimétricos hacia la derecha muestra tiempos de espera. La mayoría de los tiempos de espera son relativamente cortos y solo unos pocos tiempos de espera son largos. La gráfica de tallo y hoja con datos asimétricos hacia la izquierda muestra datos de tiempo de falla. Unos pocos elementos fallan inmediatamente y muchos más fallan posteriormente.
Si usted está en conocimiento de que sus datos no son naturalemente asimétricos, investigue las posibles causas. Si desea analizar los datos marcadamente asimétricos, lea el tema Consideraciones acerca de los datos para el análisis a fin de asegurarse de que pueda utilizar los datos que no sean normales.
Los valores atípicos, que son valores de datos que se encuentran alejados de otros valores de datos, pueden afectar sustancialmente los resultados.
Intente identificar la causa de cualesquiera valores atípicos. Corrija cualquier error de entrada de datos. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). Luego, repita el análisis.
Los datos multimodales tienen más de un pico. (Un pico representa el modo de un conjunto de datos). Los datos multimodales generalmente ocurren cuando los datos se recopilan a partir de más de un proceso o condición, como por ejemplo en más de una temperatura.
Por ejemplo, estas gráficas de tallo y hoja son gráficas de los mismos datos. La gráfica de tallo y hoja simple tiene dos conglomerados, pero no está claro que significan los conglomerados. La gráfica de tallo y hoja con grupos muestra que los conglomerados corresponden a dos grupos.
Si tiene información adicional que le permita clasificar las observaciones en grupos, usted puede crear una variable grupal con esta información. Luego, puede crear la gráfica con grupos para determinar si la variable de grupo representa los picos en los datos.