El nivel de significancia (denotado como α o alfa) es el máximo nivel de riesgo aceptable de rechazar la hipótesis nula cuando la hipótesis nula es verdadera (error tipo I). El valor predeterminado es 0.05.
Utilice el nivel de significancia para decidir si rechaza o no rechaza la hipótesis nula (H0). Si la probabilidad de que ocurra un evento es menor que el nivel de significancia, la interpretación habitual es que los resultados son estadísticamente significativos y usted rechaza H0.
El tamaño de la muestra (N) es el número total de observaciones en la muestra.
El tamaño de la muestra afecta la potencia de la prueba.
Por lo general, con un tamaño de muestra más grande, la prueba tiene más potencia para detectar un valor atípico. Para obtener más información, vaya a ¿Qué es potencia?.
La media es el promedio de los datos, que es la suma de todas las observaciones dividida entre el número de observaciones.
Utilice la media para describir la muestra con un solo valor que representa el centro de los datos. Muchos análisis estadísticos utilizan la media como una medida estándar del centro de la distribución de los datos.
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido.
Debido a que la desviación estándar utiliza las mismas unidades que los datos, generalmente es más fácil de interpretar que la varianza.
Utilice la desviación estándar para determinar qué tan dispersos están los datos con respecto a la media. Un valor de desviación estándar más alto indica una mayor dispersión de los datos. Una buena regla empírica para una distribución normal es que aproximadamente 68% de los valores se ubican dentro de una desviación estándar de la media, 95% de los valores se ubican dentro de dos desviaciones estándar y 99.7% de los valores se ubican dentro de tres desviaciones estándar.
El máximo es el valor más grande de los datos.
En estos datos, el máximo es 19.
13 | 17 | 18 | 19 | 12 | 10 | 7 | 9 | 14 |
Utilice el máximo para identificar un posible valor atípico o error de entrada de datos. Una de las maneras más sencillas de evaluar la dispersión de los datos consiste en comparar el mínimo y el máximo. Si el valor máximo es muy alto, incluso cuando considere el centro, la dispersión y la forma de los datos, investigue la causa del valor extremo.
El mínimo es el valor más pequeño de los datos.
En estos datos, el mínimo es 7.
13 | 17 | 18 | 19 | 12 | 10 | 7 | 9 | 14 |
Utilice el mínimo para identificar un posible valor atípico o un error de entrada de datos. Una de las maneras más sencillas de evaluar la dispersión de los datos consiste en comparar el mínimo y el máximo. Si el valor mínimo es muy bajo, incluso cuando considere el centro, la dispersión y la forma de los datos, investigue la causa del valor extremo.
Un valor atípico es una observación extrañamente grande o pequeña. Trate de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (también conocidos como causas especiales).
La fila de la hoja de trabajo que contiene el valor atípico. Minitab solo muestra este valor cuando existe un valor atípico.
Cuando usted utiliza una de las pruebas de relación de Dixon, Minitab muestra más observaciones en la tabla de la prueba, además del mínimo y el máximo. El valor entre corchetes indica el tamaño de la observación con respecto a los otros valores. Por ejemplo, x[2] denota la 2da observación más pequeña y x[N-1] denota la 2da observación más grande.
El estadístico de la prueba de Grubbs (G) es la diferencia entre la media de la muestra y el valor de los datos más grande o más pequeño, dividida entre la desviación estándar. Minitab utiliza el estadístico de la prueba de Grubbs para calcular el valor p, que es la probabilidad de rechazar la hipótesis nula cuando es verdadera.
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Un valor p más pequeño proporciona una evidencia más fuerte en contra de la hipótesis nula.
Utilice el valor p para determinar si existe un valor atípico.
Una gráfica de valores atípicos es similar a una gráfica de valores individuales. Utilice la gráfica de valores atípicos para identificar visualmente un valor atípico en los datos. Si existe un valor atípico, Minitab lo representa en la gráfica como un cuadro rojo. Trate de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (también conocidos como causas especiales).