Cómo la asimetría y la curtosis afectan la distribución

Utilice la asimetría y la curtosis como ayuda para lograr entender inicialmente los datos.

Asimetría

La asimetría es el grado en que los datos no son simétricos. El hecho de que el valor de la asimetría sea 0, positivo o negativo, revela información sobre la forma de los datos.
Figura A
Figura B
Distribuciones simétricas o no asimétricas

A medida que los datos se vuelven más simétricos, el valor de su asimetría se acerca a cero. La figura A muestra datos distribuidos normalmente, que por definición exhiben relativamente poca asimetría. Al dibujar una línea por el medio de este histograma de datos normales, se puede ver fácilmente que un lado es el reflejo del otro. Pero la falta de asimetría por sí sola no implica normalidad. La figura B muestra una distribución en la que ambos lados siguen siendo un reflejo el uno del otro, a pesar de que la distribución de los datos dista mucho de ser normal.

Distribuciones asimétricas positivas o hacia la derecha

Los datos con asimetría positiva o asimétricos hacia la derecha se llaman así porque la "cola" de la distribución apunta hacia la derecha y porque el valor de asimetría es mayor que 0 (es decir, positivo). Los datos sobre salarios suelen ser asimétricos de esta manera: muchos empleados de una empresa ganan relativamente poco, mientras que cada vez menos personas ganan salarios muy elevados.

Distribuciones asimétricas negativas o hacia la izquierda

Los datos asimétricos hacia la izquierda o con asimetría negativa se llaman así porque la "cola" de la distribución apunta hacia la izquierda y porque producen un valor de asimetría negativo. Los datos de tasas de fallas suelen ser asimétricos a la izquierda. Consideremos el caso de los focos: muy pocos se quemarán inmediatamente, la gran mayoría dura un tiempo considerablemente largo.

Curtosis

La curtosis indica la manera en que las colas de una distribución difieren de la distribución normal. Utilice la curtosis como ayuda para lograr entender inicialmente las características generales de la distribución de los datos.
Línea de base: Valor de curtosis de 0

Los datos que siguen una distribución normal perfectamente tienen un valor de curtosis de 0. Los datos distribuidos normalmente establecen la línea de base para la curtosis. Una curtosis de la muestra que se desvía significativamente de 0 puede indicar que los datos no están distribuidos normalmente.

Curtosis positiva

Una distribución con un valor positivo de curtosis indica que la distribución tiene colas más pesadas que la distribución normal. Por ejemplo, los datos que siguen una distribución t tienen un valor positivo de curtosis. La línea continua indica la distribución normal y la línea de puntos indica una distribución con un valor positivo de curtosis.

Curtosis negativa

Una distribución con un valor negativo de curtosis indica que la distribución tiene colas más livianas que la distribución normal. Por ejemplo, los datos que siguen una distribución beta con el primer y el segundo parámetro de forma iguales a 2 tienen un valor negativo de curtosis. La línea continua indica la distribución normal y la línea de puntos indica una distribución con un valor negativo de curtosis.