Interpretar los resultados clave para Gráfica de tallo y hoja

Complete los siguientes pasos para interpretar una gráfica de tallo y hoja.

Paso 1: Evaluar las características clave

Examine el centro y la dispersión de la distribución. Evalúe cómo el tamaño de la muestra puede afectar la apariencia de la gráfica de tallo y hoja.

Centro y dispersión

Examine los siguientes elementos para conocer más acerca de sus datos de muestra.
Conteos y mediana
Los conteos están en la primera columna a la izquierda. El conteo de la fila que contiene los valores medios está incluido en los paréntesis. Los valores de las filas por encima y por debajo de la mediana son acumulativos. El conteo de una fila por encima de la mediana representa el conteo total para esa fila y todas las filas que se encuentran por encima de ésta. El valor de una fila que se encuentra por debajo de la mediana representa el conteo total para esa fila y todas las filas que se encuentran por debajo de ésta.
valores de datos

Para cada fila, el número en el "tallo" (la columna intermedia) representa el primer dígito (o dígitos) de los valores de muestra. La "unidad de la hoja" en la parte superior de la gráfica indica qué lugar decimal representan los valores de la hoja.

Dispersión
La dispersión muestra qué tanto varían sus datos.
Esta gráfica de tallo y hoja muestra los tiempos de espera de un servicio de chat de atención al cliente en línea con un representante. La primera fila tiene un valor de tallo de 8 y contiene los valores de hoja 0, 2 y 3. La unidad de la hoja es 1. Así, la primera fila de la gráfica representa los valores de muestra de aproximadamente 80, 82 y 83. Los valores van de 80 a 119 segundos. La mediana está en la fila que tiene valores entre 95 y 99 segundos.
Tallo y hoja de C1 N = 50 3 8 023 8 8 56688 21 9 0111111222444 (6) 9 555799 23 10 0000111233 13 10 55667789 5 11 14 3 11 579 Unidad de hoja = 1

Investigue cualquier característica sorpresiva o no deseada. Por ejemplo, la gráfica de tallo y hoja de tiempos de espera de los clientes mostró valores más añtos y una dispersión más grande de lo esperado. Una investigación reveló que un tráfico web inusualmente pesado causó inestabilidad y retrasos.

Tamaño de la muestra (n)

El tamaño de la muestra puede afectar la apariencia de la gráfica.

El tamaño de la muestra se muestra en la parte superior de la gráfica de tallo y hoja. En el ejemplo previo, el tamaño de la muestra es de 50 (N = 50)

Dado que una gráfica de tallo y hoja representa cada valor de dato, es mejor cuando el tamaño de la muestra es menor que 50 aproximadamente. Si la muestra es mayor que 50, los puntos de datos en la gráfica se pueden extender demasiado lejos, y la distribución puede ser difícil de evaluar. Si tiene más de 50 puntos de datos, considere la posibilidad de utilizar una gráfica de caja o un histograma.

Paso 2: Buscar indicadores de datos inusuales o no normales

Los datos asimétricos y los datos multimodales indican que los datos podrían ser no normales. Los valores atípicos pueden indicar otras condiciones en sus datos.

Datos asimétricos

Determinar si los datos son asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. La asimetría indica que los datos pueden no estar distribuidos normalmente. Frecuentemente, es más fácil detectar la asimetría con un histograma o una gráfica de caja.

Estas gráficas de tallo y hoja ilustran los datos asimétricos. La gráfica de tallo y hoja con datos asimétricos hacia la derecha muestra tiempos de espera. La mayoría de los tiempos de espera son relativamente cortos y solo unos pocos tiempos de espera son largos. La gráfica de tallo y hoja con datos asimétricos hacia la izquierda muestra datos de tiempo de falla. Unos pocos elementos fallan inmediatamente y muchos más fallan posteriormente.

Diseño de tallo y hoja: C1

Tallo y hoja de C1 N = 50 1 -0 4 6 -0 33222 16 -0 1111111111 (16) 0 0000000011111111 18 0 22222333333 7 0 4555 3 0 6 2 0 2 1 2 1 2 1 1 4 Unidad de hoja = 0.1
Asimétrico hacia la derecha

Diseño de tallo y hoja: C1

Tallo y hoja de C1 N = 52 3 -1 333 3 -1 5 -0 99 6 -0 6 8 -0 44 24 -0 3333333322222222 (7) -0 1111111 21 0 000001111111 9 0 22233 4 0 445 1 0 6 Unidad de hoja = 0.1
Asimétrico hacia la izquierda

Si usted está en conocimiento de que sus datos no son naturalemente asimétricos, investigue las posibles causas. Si desea analizar los datos marcadamente asimétricos, lea el tema Consideraciones acerca de los datos para el análisis a fin de asegurarse de que pueda utilizar los datos que no sean normales.

Valores atípicos

Los valores atípicos, que son valores de datos que se encuentran alejados de otros valores de datos, pueden afectar sustancialmente los resultados.

En una gráfica de tallo y hoja, los valores aislados en los extremos identifican los posibles valores atípicos. Por ejemplo, el último valor en la parte inferior de esta gráfica podría ser un valor atípico.

Diseño de tallo y hoja: C1

Tallo y hoja de C1 N = 31 2 -2 20 4 -1 52 (13) -0 8886555433300 14 0 00334688 6 1 0046 2 2 5 1 3 1 4 1 5 1 6 1 7 1 8 0 Unidad de hoja = 0.1

Intente identificar la causa de cualesquiera valores atípicos. Corrija cualquier error de entrada de datos. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). Luego, repita el análisis.

Datos multimodales

Los datos multimodales tienen más de un pico. (Un pico representa el modo de un conjunto de datos). Los datos multimodales generalmente ocurren cuando los datos se recopilan a partir de más de un proceso o condición, como por ejemplo en más de una temperatura.

Por ejemplo, estas gráficas de tallo y hoja son gráficas de los mismos datos. La gráfica de tallo y hoja simple tiene dos conglomerados, pero no está claro que significan los conglomerados. La gráfica de tallo y hoja con grupos muestra que los conglomerados corresponden a dos grupos.

Diseño de tallo y hoja: C1

Tallo y hoja de C1 N = 100 2 7 18 5 8 589 21 9 0122235555677889 37 10 0122233334556778 (14) 11 13334455667789 49 12 2599 45 13 0012334667778888888 26 14 000011122236777888 8 15 0245779 1 16 1 Unidad de hoja = 0.1
Simple

Diseño de tallo y hoja: C1

Tallo y hoja de C1    C2 = 1    N = 50 2 11 59 5 12 259 24 13 0012334667778888888 (18) 14 000011122236777888 8 15 0245779 1 16 1 Unidad de hoja = 0.1
Tallo y hoja de C1    C2 = 2    N = 50 2 7 18 5 8 589 21 9 0122235555677889 (16) 10 0122233334556778 13 11 133344566778 1 12 9 Unidad de hoja = 0.1
Con grupos

Si tiene información adicional que le permita clasificar las observaciones en grupos, usted puede crear una variable grupal con esta información. Luego, puede crear la gráfica con grupos para determinar si la variable de grupo representa los picos en los datos.