Un histograma divide valores de la muestra entre muchos intervalos y representa la frecuencia de los valores de los datos en cada intervalo con una barra.
El histograma muestra visualmente los resultados de la prueba de hipótesis. Las muestras de aleatorización representan lo que sería el aspecto de una muestra aleatoria si las medias de población fueran iguales, por lo que el histograma está centrado alrededor de 0. Para una prueba unilateral, se traza una línea de referencia en la diferencia entre las medias de la muestra original. Para una prueba bilateral, se traza una línea de referencia en la diferencia entre las medias de la muestra original y en la misma distancia del lado opuesto de 0. El valor p es la proporción de diferencias entre las medias que son más extremas que los valores en las líneas de referencia. En otras palabras, el valor p es la proporción de las diferencias entre las muestras que son tan extremas como su muestra original cuando usted presupone que la hipótesis nula es verdadera. Estas diferencias aparecen en coloro rojo en el histograma.
Una gráfica de valores individuales muestra los valores individuales en la muestra. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando usted tiene relativamente pocas observaciones y también cuando debe evaluar el efecto de cada observación.
Minitab muestra una gráfica de valores individuales solamente cuando usted toma solo otra muestra. Minitab muestra tanto los datos originales como los datos de la otra muestra.
μ₁: media de población de Calificación cuando Hospital = A |
---|
µ₂: media de población de Calificación cuando Hospital = B |
Diferencia: μ₁ - µ₂ |
Hospital | N | Media | Desv.Est. | Varianza | Mínimo | Mediana | Máximo |
---|---|---|---|---|---|---|---|
A | 20 | 80.30 | 8.18 | 66.96 | 62.00 | 79.00 | 98.00 |
B | 20 | 59.30 | 12.43 | 154.54 | 35.00 | 58.50 | 89.00 |
Media de A - Media de B = 21.000 |
---|
Hipótesis nula | H₀: μ₁ - µ₂ = 0 |
---|---|
Hipótesis alterna | H₁: μ₁ - µ₂ ≠ 0 |
Número de remuestreos | Promedio | Desv.Est. | Valor p |
---|---|---|---|
1000 | -0.185 | 4.728 | < 0.002 |
En estos resultados, la hipótesis nula es que la diferencia de la población es igual a 0. La hipótesis alternativa es que la diferencia no es igual a 0.
El número de remuestreos es el número de veces que Minitab toma una muestra aleatoria con reemplazo del conjunto de datos original. Generalmente, un número elevado de remuestreos funciona mejor. El tamaño de la muestra de cada remuestreo es igual al tamaño de la muestra del conjunto de datos original. El número de remuestreos es igual al número de observaciones en el histograma.
El promedio es la suma de todas las diferencias en las medias de la muestra aleatorizada dividida entre el número de remuestreos. Minitab muestra dos valores diferentes para la diferencia en las medias, la diferencia de las muestras observadas y la diferencia de la distribución bootstrap (Promedio). Estos dos valores son una estimación de la diferencia en las medias de las poblaciones. Si hay una diferencia grande entre estos dos valores, usted debería aumentar el tamaño de la muestra de su muestra original.
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido. Debido a que la desviación estándar utiliza las mismas unidades que los datos, generalmente es más fácil de interpretar que la varianza.
La desviación estándar de las muestras bootstrap (también conocida como el error estándar bootstrap) es una estimación de la desviación estándar de la distribución de muestreo de la diferencia en las medias.
Utilice la desviación estándar para determinar qué tan dispersas están las diferencias de la muestra bootstrap con respecto a la media general de las diferencias. Un valor de desviación estándar más alto indica una mayor dispersión de las diferencias. Una buena regla empírica para una distribución normal es que aproximadamente 68% de los valores se ubican dentro de una desviación estándar de la media general, 95% de los valores se ubican dentro de dos desviaciones estándar y 99.7% de los valores se ubican dentro de tres desviaciones estándar.
Use la desviación estándar de las muestras bootstrap para determinar con qué precisión las diferencias con respecto a la muestra bootstrap estima la diferencia en las medias de población. Un valor más bajo indica una estimación más precisa de la diferencia de la población. Por lo general, una desviación estándar más grande da como resultado un mayor error estándar bootstrap y una estimación menos precisa de la diferencia de la población. Un mayor tamaño de la muestra da como resultado un menor error estándar bootstrap y una estimación más precisa de la diferencia de la población.
El valor p es la proporción de diferencias entre muestras que son tan extremas como su muestra original cuando usted presupone que la hipótesis nula es verdadera. Un valor p más pequeño proporciona una evidencia más fuerte en contra de la hipótesis nula.