El tamaño de la muestra (N) es el número total de observaciones en la muestra.
El tamaño de la muestra afecta el intervalo de confianza y la potencia de la prueba.
Generalmente, un tamaño de la muestra más grande da como resultado un intervalo de confianza más estrecho. Con un tamaño de la muestra más grande, la prueba también tendrá más potencia para detectar una diferencia. Para obtener más información, vaya a ¿Qué es potencia?.
La mediana es el punto medio del conjunto de datos. El valor de este punto medio es el punto en el cual la mitad de las observaciones está por encima del valor y la otra mitad está por debajo del valor. La mediana se determina jerarquizando las observaciones y hallando la observación que ocupe el número [N + 1] / 2 en el orden jerarquizado. Si el número de observaciones es par, entonces la mediana es el valor promedio de las observaciones jerarquizadas en los números N / 2 y [N / 2] + 1.
La mediana de cada muestra es una estimación de la mediana de población de cada muestra.
La diferencia es la diferencia entre las medianas de las dos muestras.
Puesto que la diferencia se basa en los datos de una muestra y no en toda la población, es improbable que la diferencia en las muestras sea igual a la diferencia en las poblaciones. Para estimar mejor la diferencia en las poblaciones, utilice el intervalo de confianza.
El intervalo de confianza proporciona un rango de valores probables para la diferencia de población. Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces la muestra, un determinado porcentaje de los intervalos o bordes de confianza resultantes contendría la diferencia de población desconocida. El porcentaje de estos intervalos o bordes de confianza que contiene el parámetro es el nivel de confianza del intervalo. Por ejemplo, un nivel de confianza de 95% indica que si usted toma 100 muestras aleatorias de la población, podría esperar que aproximadamente 95 de las muestras contengan la diferencia de población.
Un borde superior define un valor en comparación con el cual es probable que la diferencia de población sea menor. Un borde inferior define un valor en comparación con el cual es probable que la diferencia de población sea mayor.
El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.
Diferencia | IC para la diferencia | Confianza lograda |
---|---|---|
-1.85 | (-3, -0.9) | 95.52% |
En estos resultados, la estimación de la mediana de las poblaciones para la diferencia en el número de meses que la pintura se mantiene en dos autopistas es −1,85. Usted puede estar 95,52% seguro de que la diferencia entre las medianas de las poblaciones está entre −3,0 y −0,9.
El estadístico de Mann-Whitney (valor W) es la suma de los rangos de la primera muestra.
Minitab utiliza el estadístico de Mann-Whitney para calcular el valor p, que es una probabilidad que mide la evidencia en contra de la hipótesis nula.
Puesto que la interpretación del estadístico de Mann-Whitney depende del tamaño de la muestra, utilice el valor p para tomar una decisión sobre la prueba. El valor p tiene el mismo significado para muestras de cualquier tamaño.
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Un valor p más pequeño proporciona una evidencia más fuerte en contra de la hipótesis nula.
Utilice el valor p para determinar si la diferencia en las medianas de las poblaciones es estadísticamente significativa.
Un empate ocurre cuando el mismo valor está en ambas muestras. Si sus datos tienen empates, Minitab muestra un valor p ajustado para empates y un valor p no ajustado. El valor p ajustado por lo general es más exacto que el valor p sin ajustar. Sin embargo, el valor p sin ajustar es el cálculo más conservador, porque siempre es mayor que el valor p ajustado para un determinado par de muestras.