Interpretar los resultados clave para Mostrar estadísticos descriptivos

Complete los siguientes pasos para interpretar Mostrar estadísticos descriptivos. La salida clave incluye N, la media, la mediana, la desviación estándar y varias gráficas.

Paso 1: Describir el tamaño de la muestra

Utilice N para saber cuántas observaciones hay en la muestra. Minitab no incluye valores faltantes en este conteo.

Se recomienda recolectar una muestra de datos de mediana a grande. Muestras que tienen por lo menos 20 observaciones a menudo son adecuadas para representar la distribución de sus datos. Sin embargo, para representar mejor la distribución con un histograma, algunos profesionales recomiendan que usted tenga por lo menos 50 observaciones. Muestras más grandes también proporcionan estimaciones más precisas de los parámetros del proceso, tales como la media y la desviación estándar.

Estadísticas

VariableNN*MediaError
estándar
de la
media
Desv.Est.MínimoQ1MedianaQ3Máximo
Torsión68021.2650.7796.42210.00016.00020.00024.75037.000
Resultado clave: N

En estos resultados, usted tiene 68 observaciones.

Paso 2: Describir el centro de los datos

Utilice la media para describir la muestra con un solo valor que representa el centro de los datos. Muchos análisis estadísticos utilizan la media como una medida estándar del centro de la distribución de los datos.

La mediana es otra medida del centro de la distribución de los datos. Por lo general, los valores atípicos influyen menos en la mediana que en la media. La mitad de los valores de los datos es mayor que el valor de la mediana y la mitad de los valores de los datos es menor que el valor de la mediana.

Tanto la mediana como la media miden la tendencia central. Sin embargo, valores poco comunes, llamados valores atípicos, pueden afectar a la mediana menos de lo que afectan a la media. Si los datos son simétricos, la media y la mediana son similares.
Simétrica
No simétrica

En la distribución simétrica, la media (línea azul) y la mediana (línea naranja) son tan similares que no es fácil distinguir las dos líneas. En cambio, la distribución no simétrica es asimétrica hacia la derecha.

Estadísticas

VariableNN*MediaError
estándar
de la
media
Desv.Est.MínimoQ1MedianaQ3Máximo
Torsión68021.2650.7796.42210.00016.00020.00024.75037.000
Resultados clave: Media y mediana

En estos resultados, la torsión media que se requiere para retirar la tapa de una crema dental es 21.265 y la torsión mediana es 20. Los datos parecen ser asimétricos hacia la derecha, lo que explica por qué la media es mayor que la mediana.

Paso 3: Describir la dispersión de los datos

Utilice la desviación estándar para determinar qué tan dispersos están los datos con respecto a la media. Un valor de desviación estándar más alto indica una mayor dispersión de los datos.

Estadísticas

VariableNN*MediaError
estándar
de la
media
Desv.Est.MínimoQ1MedianaQ3Máximo
Torsión68021.2650.7796.42210.00016.00020.00024.75037.000
Resultado clave: Desv.Est.

En estos resultados, la desviación estándar es 6.422. Con datos normales, la mayoría de las observaciones se encuentran dispersas a no más de 3 desviaciones estándar a cada lado de la media.

Paso 4: Evaluar la forma y dispersión de la distribución de los datos

Utilice el histograma, la gráfica de valores individuales y la gráfica de caja para evaluar la forma y dispersión de los datos y para identificar cualquier posible valor atípico.

Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos

Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Con frecuencia, es fácil detectar la asimetría con un histograma o una gráfica de caja.

Asimétrico hacia la derecha
Asimétrico hacia la izquierda

El histograma con datos asimétricos hacia la derecha muestra tiempos de espera. La mayoría de los tiempos de espera son relativamente cortos y solo unos pocos son largos. El histograma con datos asimétricos hacia la izquierda muestra datos de tiempo de falla. Unos pocos elementos fallan inmediatamente y muchos otros fallan posteriormente.

Determine qué tanto varían los datos

Evalúe la dispersión de los puntos para determinar qué tanto varía la muestra. Mientras más variación haya en la muestra, más dispersos estarán los puntos respecto del centro de los datos.

Esta gráfica de valores individuales muestra que los datos a la derecha tienen más variación que los datos a la izquierda.

Busque datos multimodales

Los datos multimodales tienen múltiples picos, también denominados modas. Los datos multimodales suelen indicar que aún no se han considerado variables importantes.

Si usted tiene información adicional que le permita clasificar las observaciones en grupos, puede crear una variable de grupo con esta información. Luego, puede crear la gráfica con los grupos para determinar si la variable de grupo explica los picos en los datos.

Simple
Con grupos

Por ejemplo, un gerente de un banco recolecta datos de tiempos de espera y crea un histograma simple. El histograma parece tener dos picos. Después de una investigación más a fondo, el gerente determina que el tiempo de espera de los clientes que están cobrando un cheque es más corto que el tiempo de espera de los clientes que están solicitando una hipoteca. El gerente agrega una variable de grupo para la tarea que realizan los clientes y luego crea un histograma con grupos.

Identifique valores atípicos

Los valores atípicos, que son valores de datos que están muy distantes de otros valores de datos, pueden afectar considerablemente los resultados de un análisis. Con frecuencia, es fácil identificar los valores atípicos en una gráfica de caja.

En una gráfica de caja, los asteriscos (*) denotan valores atípicos.

Trate de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (también conocidos como causas especiales). Luego, repita el análisis. Para obtener más información, vaya a Identificar valores atípicos.

Paso 5: Comparar datos de grupos diferentes

Si usted tiene una Por variable que identifica grupos en sus datos, puede utilizarla para analizar los datos por grupo o por nivel de grupo.

Estadísticas

VariableMáquinaNN*MediaError
estándar
de la
media
Desv.Est.MínimoQ1MedianaQ3
Torsión136018.6670.7324.39510.00015.25017.00021.750
  232024.191.267.1214.0017.5024.0031.00
VariableMáquinaMáximo
Torsión130.000
  237.00

En estos resultados, los estadísticos de resumen se calculan por separado para cada máquina. Usted puede ver fácilmente las diferencias en el centro y la dispersión de los datos de cada máquina. Por ejemplo, la Máquina 1 tiene una torsión media más baja y menos variación que la Máquina 2. Para determinar si la diferencia en las medias es significativa, puede realizar una prueba t de 2 muestras.