A2 mide el área entre la línea ajustada (que se basa en la distribución elegida) y la función de paso no paramétrica (que se basa en los puntos de la gráfica). El estadístico es una distancia elevada al cuadrado que tiene mayor ponderación en las colas de la distribución. Un valor pequeño de Anderson-Darling indica que la distribución se ajusta mejor a los datos.
La prueba de normalidad de Anderson-Darling se define de la siguiente manera:
H0: Los datos siguen una distribución normal
H1: Los datos no siguen una distribución normal
Término | Description |
---|---|
F(Yi) | ![]() |
Yi | datos ordenados |
Una medida cuantitativa para notificar los resultados de la prueba de normalidad de Anderson-Darling es el valor p. Un valor p pequeño indica que la hipótesis nula es falsa.
Si usted conoce A 2, puede calcular el valor p.
Sea
El número de valores presentes en la muestra.
La desviación estándar de la muestra proporciona una medida de la dispersión de los datos. Es igual a la raíz cuadrada de la varianza de la muestra.
Término | Description |
---|---|
x i | i ésima observación |
![]() | media de las observaciones |
N | número de observaciones presentes |
La varianza mide qué tan dispersos están los datos alrededor de su media. La varianza es igual a la desviación estándar elevada al cuadrado.
Término | Description |
---|---|
xi | iésima observación |
![]() | media de las observaciones |
N | número de observaciones presentes |
La asimetría es una medida de la condición asimétrica. Un valor negativo indica asimetría a la izquierda y un valor positivo indica asimetría a la derecha. Un valor de cero no necesariamente indica simetría.
Término | Description |
---|---|
xi | i ésima observación |
![]() | media de las observaciones |
N | número de observaciones presentes |
s | desviación estándar de la muestra |
La curtosis es una medida de qué tan diferente es una distribución con respecto a la distribución normal. Un valor positivo por lo general indica que la distribución tiene un pico más pronunciado que la distribución normal. Un valor negativo indica que la distribución tiene un pico más plano que la distribución normal.
Término | Description |
---|---|
xi | i ésima observación |
![]() | media de las observaciones |
N | número de observaciones presentes |
s | desviación estándar de la muestra |
Una medida frecuentemente utilizada del centro de un lote de números. La media también se denomina promedio. Es la suma de todas las observaciones dividida entre el número de observaciones (presentes).
Término | Description |
---|---|
xi | i ésima observación |
N | número de observaciones presentes |
El valor más pequeño del conjunto de datos.
El valor más grande del conjunto de datos.
25% de las observaciones de la muestra son menores que o iguales al valor del 1er cuartil. Por lo tanto, el 1er cuartil también se conoce como el percentil 25.
Término | Description |
---|---|
Y | valor entero truncado de w |
w | ![]() |
z | componente fraccionado de w que fue truncado |
xj | jiésima observación en la lista de datos de la muestra, ordenados del más pequeño al más grande |
Cuando w es un entero, y = w, z = 0 y Q1 = xy.
La mediana de la muestra está en la mitad de los datos: por lo menos la mitad de las observaciones es menor que o igual a la mediana y por lo menos la mitad de las observaciones es mayor que o igual a la mediana.
Supongamos que usted tiene una columna que contiene N valores. Para calcular la mediana, primero ordene los valores de los datos del más pequeño al más grande. Si N es impar, la mediana de la muestra es el valor del medio. Si N es par, la mediana es el promedio de los dos valores del medio.
Por ejemplo, cuando N = 5 y usted tiene los datos x1, x2, x3, x4 y x5, la mediana = x3.
Cuando N = 6 y usted ordenó los datos x1, x2, x3, x4, x5 y x6:
donde x3 y x4 son la tercera y la cuarta observación
75% de las observaciones de la muestra son menores que o iguales al valor del tercer cuartil. Por lo tanto, el tercer cuartil también se conoce como el percentil 75.
Término | Description |
---|---|
Y | valor truncado de w |
w |
![]() |
z | componente fraccionado de w que fue truncado |
xj | jiésima observación en la lista de datos de la muestra, ordenados del más pequeño al más grande |
Cuando w es un entero, y = w, z = 0 y Q3 = xy.
Término | Description |
---|---|
![]() | media |
s | desviación estándar de la muestra |
N | número de valores presentes |
t N, α | probabilidad acumulada inversa de una distribución t con N – 1 grados de libertad en 1 – α / 2; α = 1 – nivel de confianza / 100 |
Minitab utiliza una interpolación no lineal para calcular el intervalo de confianza para la mediana real 1. Este método es una aproximación muy adecuada para una amplia variedad de distribuciones simétricas, incluidas la distribución normal, la distribución de Cauchy y la distribución uniforme. Ejemplos de distribuciones no simétricas muestran resultados adecuados que siempre son mucho más exactos que la interpolación lineal.
Minitab calcula un intervalo de confianza de (1 – α) 100% para la desviación estándar de la población, σ. El intervalo de confianza es muy sensible al supuesto de que los datos son normales. Incluso desviaciones menores de la normalidad pueden dar como resultado un intervalo de confianza que sea engañoso.
El intervalo de confianza va de:
Término | Description |
---|---|
s | desviación estándar |
N | número de valores presentes |
χ2N, α | probabilidad acumulada inversa de una χ2 con N grados de libertad en 1 – α / 2; α = 1 – nivel de confianza / 100 |