El tamaño de la muestra (N) es el número total de observaciones en cada grupo.
El tamaño de la muestra afecta el intervalo de confianza y la potencia de la prueba.
Generalmente, una muestra más grande produce un intervalo de confianza más estrecho. Con un tamaño de muestra más grande, la prueba también tendrá más potencia para detectar una diferencia.
La media de las observaciones dentro de cada grupo. La media describe cada grupo con un valor simple que identifique el centro de los datos. Es la suma de todas las observaciones con un grupo dividida entre el número de observaciones en ese grupo.
La media de cada muestra proporciona una estimación de la media de cada población. Las diferencias entre las medias de muestra son las estimaciones de las diferencias entre las medias de población.
Debido a que cada diferencia en las medias de los grupos se basa en los datos de una muestra y no de toda la población, usted no puede estar seguro de que sea igual a la diferencia en las poblaciones. Para obtener un mejor sentido de la diferencia poblacional, puede utilizar el intervalo de confianza.
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. El símbolo σ (sigma) suele utilizarse para representar la desviación estándar de una población. El símbolo s se utiliza para representar la desviación estándar de una muestra.
La desviación estándar de la muestra de un grupo es una estimación de la desviación estándar de la población de ese grupo. Las desviaciones estándar se utilizan para calcular los intervalos de confianza y los valores p. Las desviaciones estándar de la muestra dan como resultado intervalos de confianza menos precisos (más amplios) y baja potencia estadística.
El análisis de varianza presupone que las desviaciones estándar de la población para todos los niveles son iguales. Si no se puede asumir varianzas iguales, use la prueba de Welch de ANOVA, que es una opción de ANOVA de un solo factor.
Estos intervalos de confianza (IC) son rangos de valores que probablemente contienen la media real de cada población. Los intervalos de confianza se calculan usando la desviación estándar agrupada.
Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si usted repite la muestra muchas veces, un determinado porcentaje de los intervalos de confianza resultantes incluirá el parámetro de población desconocido. El porcentaje de estos intervalos de confianza que contiene el parámetro es el nivel de confianza del intervalo.
Utilice el intervalo de confianza para evaluar la estimación de la media de la población para cada grupo.
Por ejemplo, con un nivel de confianza de 95%, usted puede estar 95% seguro de que el intervalo de confianza contiene la media del grupo. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.
Pintura | N | Media | Desv.Est. | IC de 95% |
---|---|---|---|---|
Mezcla 1 | 6 | 14.73 | 3.36 | (11.37, 18.10) |
Mezcla 2 | 6 | 8.57 | 5.50 | (5.20, 11.93) |
Mezcla 3 | 6 | 12.98 | 3.73 | (9.62, 16.35) |
Mezcla 4 | 6 | 18.07 | 2.64 | (14.70, 21.43) |
En estos resultados, cada mezcla tiene un intervalo de confianza para su dureza media. Los resultados de las comparaciones múltiples de estos datos muestran que la Mezcla 4 es significativamente más dura que la Mezcla 2. Que la Mezcla 4 sea más dura que la Mezcla 2 no demuestra que la mezcla 4 sea lo suficientemente dura para el uso previsto de la pintura. El intervalo de confianza para la media de grupo es mejor para juzgar si la Mezcla 4 es lo suficientemente dura.
La desviación estándar agrupada es un estimado de la desviación estándar común para todos los niveles. La desviación estándar agrupada es la desviación estándar de todos los puntos de los datos alrededor de la media del grupo (no de la media general). Grupos más grandes tienen una influencia proporcionalmente mayor en la estimación general de la desviación estándar agrupada.
Un valor de desviación estándar más alto indica una mayor dispersión de los datos. Un valor más alto produce intervalos de confianza menos precisos (más amplios) y baja potencia estadística.
Minitab utiliza la desviación estándar agrupada para crear los intervalos de confianza tanto para las medias de grupo como para las diferencias entre las medias de grupo.
Grupo | Media | Desviación estándar | N |
---|---|---|---|
1 | 9.7 | 2.5 | 50 |
2 | 12.1 | 2.9 | 50 |
3 | 14.5 | 3.2 | 50 |
4 | 17.3 | 6.8 | 200 |
Los primeros tres grupos tienen el mismo tamaño (n=50) con desviaciones estándar de aproximadamente 3. El cuarto grupo es mucho más grande (n=200) y tiene una desviación estándar mayor (6.8). Puesto que la desviación estándar agrupada utiliza un promedio ponderado, su valor (5.488) está más cerca de la desviación estándar del grupo más grande.