Métodos y fórmulas para Resumen gráfico

Seleccione el método o la fórmula de su preferencia.

Estadística de Anderson-Darling (A2)

A2 mide el área entre la línea ajustada (que se basa en la distribución elegida) y la función de paso no paramétrica (que se basa en los puntos de la gráfica). El estadístico es una distancia elevada al cuadrado que tiene mayor ponderación en las colas de la distribución. Un valor pequeño de Anderson-Darling indica que la distribución se ajusta mejor a los datos.

La prueba de normalidad de Anderson-Darling se define de la siguiente manera:

H0: Los datos siguen una distribución normal

H1: Los datos no siguen una distribución normal

Fórmula

Notación

TérminoDescription
F(Yi), que es la función de distribución acumulada de la distribución normal estándar
Yidatos ordenados

Valor p para la prueba de normalidad de Anderson-Darling

Una medida cuantitativa para notificar los resultados de la prueba de normalidad de Anderson-Darling es el valor p. Un valor p pequeño indica que la hipótesis nula es falsa.

Si usted conoce A 2, puede calcular el valor p.

Sea

Dependiendo de A'2, usted calculará p con las siguientes ecuaciones:
  • Si 13 > A'2 > 0.600, entonces p = exp(1.2937 - 5.709 * A'2 + 0.0186(A'2)2)
  • Si 0.600 > A'2 > 0.340, entonces p = exp(0.9177 - 4.279 * A'2 – 1.38(A'2)2)
  • Si 0.340 > A'2 > 0.200 entonces p = 1 – exp(–8.318 + 42.796 * A'2 – 59.938(A'2)2)
  • Si A'2 < 0.200, entonces p = 1 – exp(–13.436 + 101.14 * A'2 – 223.73(A'2)2)

N valores presentes (N)

El número de valores presentes en la muestra.

Desviación estándar (Desv.Est.)

La desviación estándar de la muestra proporciona una medida de la dispersión de los datos. Es igual a la raíz cuadrada de la varianza de la muestra.

Fórmula

Si la columna contiene x 1, x 2,..., x N, con media , entonces la desviación estándar de la muestra es:

Notación

TérminoDescription
x i i ésima observación
media de las observaciones
N número de observaciones presentes

Varianza

La varianza mide qué tan dispersos están los datos alrededor de su media. La varianza es igual a la desviación estándar elevada al cuadrado.

Fórmula

Notación

TérminoDescription
xiiésima observación
media de las observaciones
Nnúmero de observaciones presentes

Asimetría

La asimetría es una medida de la condición asimétrica. Un valor negativo indica asimetría a la izquierda y un valor positivo indica asimetría a la derecha. Un valor de cero no necesariamente indica simetría.

Fórmula

Notación

TérminoDescription
xi i ésima observación
media de las observaciones
N número de observaciones presentes
s desviación estándar de la muestra

Curtosis

La curtosis es una medida de qué tan diferente es una distribución con respecto a la distribución normal. Un valor positivo por lo general indica que la distribución tiene un pico más pronunciado que la distribución normal. Un valor negativo indica que la distribución tiene un pico más plano que la distribución normal.

Fórmula

Notación

TérminoDescription
xi i ésima observación
media de las observaciones
N número de observaciones presentes
s desviación estándar de la muestra

Media

Una medida frecuentemente utilizada del centro de un lote de números. La media también se denomina promedio. Es la suma de todas las observaciones dividida entre el número de observaciones (presentes).

Fórmula

Notación

TérminoDescription
xii ésima observación
Nnúmero de observaciones presentes

Mínimo

El valor más pequeño del conjunto de datos.

Máximo

El valor más grande del conjunto de datos.

1er cuartil (Q1)

25% de las observaciones de la muestra son menores que o iguales al valor del 1er cuartil. Por lo tanto, el 1er cuartil también se conoce como el percentil 25.

Fórmula

Notación

TérminoDescription
Yvalor entero truncado de w
w
zcomponente fraccionado de w que fue truncado
xjjiésima observación en la lista de datos de la muestra, ordenados del más pequeño al más grande
Nota

Cuando w es un entero, y = w, z = 0 y Q1 = xy.

Mediana

La mediana de la muestra está en la mitad de los datos: por lo menos la mitad de las observaciones es menor que o igual a la mediana y por lo menos la mitad de las observaciones es mayor que o igual a la mediana.

Supongamos que usted tiene una columna que contiene N valores. Para calcular la mediana, primero ordene los valores de los datos del más pequeño al más grande. Si N es impar, la mediana de la muestra es el valor del medio. Si N es par, la mediana es el promedio de los dos valores del medio.

Por ejemplo, cuando N = 5 y usted tiene los datos x1, x2, x3, x4 y x5, la mediana = x3.

Cuando N = 6 y usted ordenó los datos x1, x2, x3, x4, x5 y x6:

donde x3 y x4 son la tercera y la cuarta observación

3er cuartil (Q3)

75% de las observaciones de la muestra son menores que o iguales al valor del tercer cuartil. Por lo tanto, el tercer cuartil también se conoce como el percentil 75.

Fórmula

Notación

TérminoDescription
Yvalor truncado de w
w
zcomponente fraccionado de w que fue truncado
xjjiésima observación en la lista de datos de la muestra, ordenados del más pequeño al más grande
Nota

Cuando w es un entero, y = w, z = 0 y Q3 = xy.

Intervalo de confianza para la media

Fórmula

Notación

TérminoDescription
media
s desviación estándar de la muestra
N número de valores presentes
t N, α probabilidad acumulada inversa de una distribución t con N – 1 grados de libertad en 1 – α / 2; α = 1 – nivel de confianza / 100

Intervalo de confianza para la mediana

Minitab utiliza una interpolación no lineal para calcular el intervalo de confianza para la mediana real 1. Este método es una aproximación muy adecuada para una amplia variedad de distribuciones simétricas, incluidas la distribución normal, la distribución de Cauchy y la distribución uniforme. Ejemplos de distribuciones no simétricas muestran resultados adecuados que siempre son mucho más exactos que la interpolación lineal.

Intervalo de confianza para la desviación estándar

Minitab calcula un intervalo de confianza de (1 – α) 100% para la desviación estándar de la población, σ. El intervalo de confianza es muy sensible al supuesto de que los datos son normales. Incluso desviaciones menores de la normalidad pueden dar como resultado un intervalo de confianza que sea engañoso.

Fórmula

El intervalo de confianza va de:

Notación

TérminoDescription
sdesviación estándar
Nnúmero de valores presentes
χ2N, αprobabilidad acumulada inversa de una χ2 con N grados de libertad en 1 – α / 2; α = 1 – nivel de confianza / 100
1 T.P. Hettmansperger y S.J. Sheather (1986). "Confidence Intervals Based on Interpolated Order Statistics," Statistics and Probability Letters, 4, 75-79.
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política