Métodos y fórmulas para Prueba de normalidad

Seleccione el método o la fórmula de su preferencia.

Media

Una medida frecuentemente utilizada del centro de un lote de números. La media también se denomina promedio. Es la suma de todas las observaciones dividida entre el número de observaciones (presentes).

Fórmula

Notación

TérminoDescription
xii ésima observación
Nnúmero de observaciones presentes

Desviación estándar (Desv.Est.)

La desviación estándar de la muestra proporciona una medida de la dispersión de los datos. Es igual a la raíz cuadrada de la varianza de la muestra.

Fórmula

Si la columna contiene x 1, x 2,..., x N, con media , entonces la desviación estándar de la muestra es:

Notación

TérminoDescription
x i i ésima observación
media de las observaciones
N número de observaciones presentes

N

Minitab muestra el número de observaciones presentes en una muestra.

Estadística de Anderson-Darling (A2)

A2 mide el área entre la línea ajustada (que se basa en la distribución elegida) y la función de paso no paramétrica (que se basa en los puntos de la gráfica). El estadístico es una distancia elevada al cuadrado que tiene mayor ponderación en las colas de la distribución. Un valor pequeño de Anderson-Darling indica que la distribución se ajusta mejor a los datos.

La prueba de normalidad de Anderson-Darling se define de la siguiente manera:

H0: Los datos siguen una distribución normal

H1: Los datos no siguen una distribución normal

Fórmula

Notación

TérminoDescription
F(Yi), que es la función de distribución acumulada de la distribución normal estándar
Yidatos ordenados

Ryan-Joiner

La prueba de Ryan-Joiner proporciona un coeficiente de correlación, que indica la correlación entre los datos y las puntuaciones normales de los datos. Si el coeficiente de correlación está cerca de 1, los datos se encuentran cerca de la gráfica de probabilidad normal. Si es menor que el valor crítico adecuado, usted rechazará la hipótesis nula de normalidad.

Fórmula

El coeficiente de correlación se calcula de la siguiente manera:

Notación

TérminoDescription
Yi observaciones ordenadas
bi puntuaciones normales de los datos ordenados
s2varianza de la muestra

Kolmogorov-Smirnov

Fórmula

La prueba de Kolmogorov-Smirnov se define como:
  • H0: Los datos siguen una distribución normal
  • H1: Los datos no siguen una distribución normal
El estadístico de la prueba de Kolmogorov-Smirnov se define como:

Notación

TérminoDescription
D+ máx.i {i / nZ (i)}
D máx.i {Z (i) – (i – 1) / n)}
Z F(X(i))
F(x)función de distribución de probabilidad de la distribución normal
X(i) estadísticos de iésimo orden de una muestra aleatoria, 1 ≤ i ≤ n
n tamaño de la muestra

Valor p

Otra medida cuantitativa para notificar los resultados de la prueba de normalidad es el valor p. Un valor p pequeño es una indicación de que la hipótesis nula es falsa.

Si usted conoce A2, puede calcular el valor p. Sea:
Dependiendo de A'2, usted calculará p con las siguientes ecuaciones:
  • Si 13 > A'2 > 0.600, entonces p = exp(1.2937 - 5.709 * A'2 + 0.0186(A'2)2)
  • Si 0.600 > A'2 > 0.340, entonces p = exp(0.9177 - 4.279 * A'2 – 1.38(A'2)2)
  • Si 0.340 > A'2 > 0.200, entonces p = 1 – exp(–8.318 + 42.796 * A'2 – 59.938(A'2)2)
  • Si A'2 <0.200, entonces p = 1 – exp(–13.436 + 101.14 * A'2 – 223.73(A'2)2)

Puntos de la gráfica

En general, mientras más cerca se encuentren los puntos de la línea ajustada, mejor será el ajuste. Minitab provee dos medidas de bondad de ajuste que ayudan a evaluar la forma en que la distribución se ajusta a los datos.

Fórmula

La siguiente tabla muestra cómo se construye la línea intermedia:
Distribución coordenada x coordenada y
Normal x Φ–1 norm

Notación

TérminoDescription
Φ–1 norm valor devuelto para p por la cdf inversa para la distribución normal estándar

Gráficas de probabilidad

Los datos de entrada se grafican como los valores de X. Minitab calcula la probabilidad de ocurrencia sin presuponer una distribución. La escala Y de la gráfica se asemeja a la escala Y incluida en el artículo sobre probabilidad normal donde las probabilidades se grafican como una línea recta, como si los datos provinieran de una distribución normal.