El tamaño de la muestra (N) es el número total de observaciones en la muestra.
El tamaño de la muestra afecta el intervalo de confianza y la potencia de la prueba.
Generalmente, un tamaño de la muestra más grande da como resultado un intervalo de confianza más estrecho. Con un tamaño de la muestra más grande, la prueba también tendrá más potencia para detectar una diferencia. Para obtener más información, vaya a ¿Qué es potencia?.
La media resume los valores de la muestra con un valor individual que representa el centro de los datos. La media es el promedio de los datos, que es la suma de todas las observaciones dividida entre el número de observaciones.
La media de cada muestra es una estimación de la media de población de cada muestra.
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido.
La desviación estándar utiliza las mismas unidades que los datos.
Utilice la desviación estándar para determinar qué tan dispersos están los datos con respecto a la media. Un valor de desviación estándar más alto indica una mayor dispersión de los datos. Una buena regla empírica para una distribución normal es que aproximadamente 68% de los valores se ubican dentro de una desviación estándar de la media, 95% de los valores se ubican dentro de dos desviaciones estándar y 99.7% de los valores se ubican dentro de tres desviaciones estándar.
La desviación estándar de cada muestra es una estimación de la desviación estándar de cada población. Las desviaciones estándar se usan para calcular el intervalo de confianza y el valor p. Un valor más alto produce intervalos de confianza menos precisos (más amplios) y pruebas menos potentes.
El error estándar de la media (EE de la media) estima la variabilidad entre las medias de las muestras que usted obtendría si tomara muestras repetidas de la misma población. Mientras que el error estándar de la media estima la variabilidad entre las muestras, la desviación estándar mide la variabilidad dentro de una misma muestra.
Por ejemplo, usted tiene un tiempo de entrega medio de 3.80 días, con una desviación estándar de 1.43 días, de una muestra aleatoria de 312 tiempos de entrega. Estos números producen un error estándar de la media de 0.08 días (1.43 dividido entre la raíz cuadrada de 312). De haber tomado múltiples muestras aleatorias del mismo tamaño y de la misma población, la desviación estándar de esas medias diferentes de las muestras habría sido aproximadamente 0.08 días.
Utilice el error estándar de la media para determinar el grado de precisión con el que la media de la muestra estima la media de la población.
Un valor del error estándar de la media más bajo indica una estimación más precisa de la media de la población. Por lo general, una desviación estándar más grande se traducirá en un mayor error estándar de la media y una estimación menos precisa de la media de la población. Un tamaño de muestra más grande dará como resultado un menor error estándar de la media y una estimación más precisa de la media de la población.
Minitab utiliza el error estándar de la media para calcular el intervalo de confianza.
La diferencia es la diferencia desconocida entre las medias de población que usted desea estimar. Minitab indica cuál media de población se resta de la otra.
La diferencia es la diferencia entre las medias de las dos muestras.
Puesto que la diferencia se basa en los datos de una muestra y no en toda la población, es improbable que la diferencia en las muestras sea igual a la diferencia en las poblaciones. Para estimar mejor la diferencia en las poblaciones, utilice el intervalo de confianza de la diferencia.
El intervalo de confianza proporciona un rango de valores probables para la diferencia de población. Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces la muestra, un determinado porcentaje de los intervalos o bordes de confianza resultantes contendría la diferencia de población desconocida. El porcentaje de estos intervalos o bordes de confianza que contiene el parámetro es el nivel de confianza del intervalo. Por ejemplo, un nivel de confianza de 95% indica que si usted toma 100 muestras aleatorias de la población, podría esperar que aproximadamente 95 de las muestras contengan la diferencia de población.
Un borde superior define un valor en comparación con el cual es probable que la diferencia de población sea menor. Un borde inferior define un valor en comparación con el cual es probable que la diferencia de población sea mayor.
El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra. Para obtener más información, vaya a Maneras de obtener un intervalo de confianza más preciso.
Diferencia | IC de 95% para la diferencia |
---|---|
21.00 | (14.22, 27.78) |
En estos resultados, la estimación de la diferencia en las medias de las poblaciones en las calificaciones de los hospitales es 21. Usted puede estar 95% seguro de que la media de las poblaciones está entre 14,22 y 27,78.
En la salida, las hipótesis nula y alternativa le ayudan a verificar que usted ingresó el valor correcto de la diferencia de la prueba.
El valor t es el valor observado del estadístico de la prueba t que mide la diferencia entre un estadístico de muestra observado y su parámetro hipotético de población en unidades de error estándar.
Usted puede comparar el valor t con los valores críticos de la distribución t para determinar si puede rechazar la hipótesis nula. Sin embargo, por lo general es más práctico y conveniente utilizar el valor p de la prueba para hacer la misma determinación.
Para determinar si puede rechazar la hipótesis nula, compare el valor t con el valor crítico. Cuando usted presupone varianzas iguales, el valor crítico es tα/2, n+m–2 para una prueba bilateral y tα, n+m–2 para una prueba unilateral. Cuando no puede presuponer varianzas iguales, el valor crítico es tα/2, r para una prueba bilateral y tα, r para una prueba unilateral, donde r representa los grados de libertad. Para una prueba bilateral, si el valor absoluto del valor t es mayor que el valor crítico, usted rechaza la hipótesis nula. De lo contrario, no puede rechazar la hipótesis nula. Puede calcular el valor crítico en Minitab o buscar el valor crítico en una tabla de distribución t en la mayoría de los libros de estadística. Para obtener más información, vaya a Uso de la función de distribución acumulada inversa (ICDF) y haga clic en "Usar la ICDF para calcular los valores críticos".
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Un valor p más pequeño proporciona una evidencia más fuerte en contra de la hipótesis nula.
Utilice el valor p para determinar si la diferencia en las medias de las poblaciones es estadísticamente significativa.
Los grados de libertad (GL) indican la cantidad de información que está disponible en los datos para estimar los valores de los parámetros desconocidos y para calcular la variabilidad de esas estimaciones. Para una prueba t de 2 muestras, los grados de libertad se determinan según el número de observaciones en la muestra y también dependen de si se puede o no se puede presuponer varianzas iguales.
Minitab utiliza los grados de libertad para determinar el estadístico de prueba. Los grados de libertad se determinan según el tamaño de la muestra. Si incrementa el tamaño de la muestra, obtendrá más información sobre la población, con lo cual aumentan los grados de libertad.
La desviación estándar agrupada es una estimación de la desviación estándar común para ambas muestras. La desviación estándar agrupada es la desviación estándar de todos los puntos de los datos alrededor de la media del grupo (no de la media general). Grupos más grandes tienen una influencia proporcionalmente mayor en la estimación general de la desviación estándar agrupada.
La desviación estándar se utiliza para calcular el intervalo de confianza y el valor p.
Un valor de desviación estándar más alto indica una mayor dispersión de los datos. Un valor más alto produce intervalos de confianza menos precisos (más amplios) y pruebas menos potentes.
Grupo | Media | Desviación estándar | N |
---|---|---|---|
1 | 9.7 | 2.5 | 50 |
2 | 17.3 | 6.8 | 200 |
El primer grupo (n=50) tiene una desviación estándar de 2.5. El segundo grupo es mucho más grande (n=200) y tiene una desviación estándar más alta (6.8). Puesto que la desviación estándar agrupada utiliza un promedio ponderado, su valor está más cerca de la desviación estándar del grupo más grande. Si usted utilizara un promedio simple, entonces ambos grupos tendrían el mismo efecto.
Una gráfica de valores individuales muestra los valores individuales en cada muestra. Una gráfica de valores individuales permite comparar fácilmente las muestras. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando usted tiene relativamente pocas observaciones y cuando también necesita evaluar el efecto de cada observación.
Utilice una gráfica de valores individuales para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de valores individuales funcionan mejor cuando el tamaño de la muestra es menor que 50.
Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Con frecuencia, es fácil detectar la asimetría con un histograma o una gráfica de caja.
Los datos marcadamente asimétricos pueden afectar la validez del valor p si las muestras son pequeñas (cualquiera de las muestras tiene menos de 15 valores). Si los datos son marcadamente asimétricos y usted tiene una muestra pequeña, considere aumentar el tamaño de la muestra.
Los valores atípicos, que son valores de datos que están muy distantes de otros valores de datos, pueden afectar considerablemente los resultados de un análisis. Con frecuencia, es fácil identificar los valores atípicos en una gráfica de caja.
Trate de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (también conocidos como causas especiales). Luego, repita el análisis. Para obtener más información, vaya a Identificar valores atípicos.
Una gráfica de caja proporciona un resumen gráfico de la distribución de cada muestra. La gráfica de caja permite comparar fácilmente la forma, tendencia central y variabilidad de las muestras.
Utilice una gráfica de caja para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de caja funcionan mejor cuando el tamaño de la muestra es mayor que 20.
Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Con frecuencia, es fácil detectar la asimetría con un histograma o una gráfica de caja.
Los datos marcadamente asimétricos pueden afectar la validez del valor p si las muestras son pequeñas (cualquiera de las muestras tiene menos de 15 valores). Si los datos son marcadamente asimétricos y usted tiene una muestra pequeña, considere aumentar el tamaño de la muestra.
Los valores atípicos, que son valores de datos que están muy distantes de otros valores de datos, pueden afectar considerablemente los resultados de un análisis. Con frecuencia, es fácil identificar los valores atípicos en una gráfica de caja.
Trate de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (también conocidos como causas especiales). Luego, repita el análisis. Para obtener más información, vaya a Identificar valores atípicos.