Estadísticos y gráficas de prueba de aleatorización para Prueba de aleatorización para medias de 2 muestras

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos y gráficas de prueba de aleatorización que se proporcionan con la prueba de aleatorización para media de 2 muestras.

Histograma

Un histograma divide valores de la muestra entre muchos intervalos y representa la frecuencia de los valores de los datos en cada intervalo con una barra.

Interpretación

Utilice el histograma para examinar la forma de la distribución bootstrap. La distribución bootstrap es la distribución del estadístico elegido de cada remuestreo La distribución bootstrap debería parecer normal. Si la distribución bootstrap es no normal, no puede confiar en los resultados del bootstrap.
50 remuestreos
1000 remuestreos

La distribución suele ser más fácil de determinar con más remuestreos. Por ejemplo, en estos datos, la distribución es ambigua para 50 remuestreos. Con 1000 remuestreos, la forma parece aproximadamente normal.

El histograma muestra visualmente los resultados de la prueba de hipótesis. Las muestras de aleatorización representan lo que sería el aspecto de una muestra aleatoria si las medias de población fueran iguales, por lo que el histograma está centrado alrededor de 0. Para una prueba unilateral, se traza una línea de referencia en la diferencia entre las medias de la muestra original. Para una prueba bilateral, se traza una línea de referencia en la diferencia entre las medias de la muestra original y en la misma distancia del lado opuesto de 0. El valor p es la proporción de diferencias entre las medias que son más extremas que los valores en las líneas de referencia. En otras palabras, el valor p es la proporción de las diferencias entre las muestras que son tan extremas como su muestra original cuando usted presupone que la hipótesis nula es verdadera. Estas diferencias aparecen en coloro rojo en el histograma.

En este histograma, la distribución bootstrap parece ser normal. Ninguna de las diferencias entre las muestras es mayor que 21 ni menor que -21.

Gráfica de valores individuales

Una gráfica de valores individuales muestra los valores individuales en la muestra. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando usted tiene relativamente pocas observaciones y también cuando debe evaluar el efecto de cada observación.

Nota

Minitab muestra una gráfica de valores individuales solamente cuando usted toma solo otra muestra. Minitab muestra tanto los datos originales como los datos de la otra muestra.

Interpretación

Utilice la gráfica de valores individuales para comparar las muestras originales y las muestras de aleatorización. Las muestras de aleatorización representan lo que sería el aspecto de una muestra aleatoria si las medias de población fueran iguales. Por lo tanto, la línea que conecta las medias de las muestras de aleatorización tiende a ser plana. Compare la diferencia en las medias de las muestras originales con la diferencia en las medias de las muestras de aleatorización. Cuanto más inclinada sea la línea entre las muestras observadas en relación con la línea entre las muestras de aleatorización, más evidencia esperaría usted contra la hipótesis nula.
Las medias de población son iguales
La media de población del grupo 1 es el doble de la media de población del grupo 2

Hipótesis nula e hipótesis alternativa

Las hipótesis nula y alternativa son dos enunciados mutuamente excluyentes acerca de una población. Una prueba de hipótesis utiliza los datos de la muestra para determinar si se puede rechazar la hipótesis nula.
Hipótesis nula
La hipótesis nula indica que un parámetro de población (tal como la media, la desviación estándar, etc.) es igual a un valor hipotético. La hipótesis nula suele ser una afirmación inicial que se basa en análisis previos o en conocimiento especializado.
Hipótesis alternativa
La hipótesis alternativa indica que un parámetro de población es más pequeño, más grande o diferente del valor hipotético de la hipótesis nula. La hipótesis alternativa es lo que usted podría pensar que es cierto o espera probar que es cierto.

Método

μ₁: media de población de Calificación cuando Hospital = A
µ₂: media de población de Calificación cuando Hospital = B
Diferencia: μ₁ - µ₂

Muestras observadas

HospitalNMediaDesv.Est.VarianzaMínimoMedianaMáximo
A2080.308.1866.9662.0079.0098.00
B2059.3012.43154.5435.0058.5089.00

Diferencia en las muestras observadas

Media de A - Media de B = 21.000

Prueba de aleatorización

Hipótesis nulaH₀: μ₁ - µ₂ = 0
Hipótesis alternaH₁: μ₁ - µ₂ ≠ 0
Número de
remuestreos
PromedioDesv.Est.Valor p
1000-0.1854.728< 0.002

En estos resultados, la hipótesis nula es que la diferencia de la población es igual a 0. La hipótesis alternativa es que la diferencia no es igual a 0.

Número de remuestreos

El número de remuestreos es el número de veces que Minitab toma una muestra aleatoria con reemplazo del conjunto de datos original. Generalmente, un número elevado de remuestreos funciona mejor. El tamaño de la muestra de cada remuestreo es igual al tamaño de la muestra del conjunto de datos original. El número de remuestreos es igual al número de observaciones en el histograma.

Promedio

El promedio es la suma de todas las diferencias en las medias de la muestra aleatorizada dividida entre el número de remuestreos. Minitab muestra dos valores diferentes para la diferencia en las medias, la diferencia de las muestras observadas y la diferencia de la distribución bootstrap (Promedio). Estos dos valores son una estimación de la diferencia en las medias de las poblaciones. Si hay una diferencia grande entre estos dos valores, usted debería aumentar el tamaño de la muestra de su muestra original.

Desv.Est. (muestra bootstrap)

La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido. Debido a que la desviación estándar utiliza las mismas unidades que los datos, generalmente es más fácil de interpretar que la varianza.

La desviación estándar de las muestras bootstrap (también conocida como el error estándar bootstrap) es una estimación de la desviación estándar de la distribución de muestreo de la diferencia en las medias.

Interpretación

Utilice la desviación estándar para determinar qué tan dispersas están las diferencias de la muestra bootstrap con respecto a la media general de las diferencias. Un valor de desviación estándar más alto indica una mayor dispersión de las diferencias. Una buena regla empírica para una distribución normal es que aproximadamente 68% de los valores se ubican dentro de una desviación estándar de la media general, 95% de los valores se ubican dentro de dos desviaciones estándar y 99.7% de los valores se ubican dentro de tres desviaciones estándar.

Use la desviación estándar de las muestras bootstrap para determinar con qué precisión las diferencias con respecto a la muestra bootstrap estima la diferencia en las medias de población. Un valor más bajo indica una estimación más precisa de la diferencia de la población. Por lo general, una desviación estándar más grande da como resultado un mayor error estándar bootstrap y una estimación menos precisa de la diferencia de la población. Un mayor tamaño de la muestra da como resultado un menor error estándar bootstrap y una estimación más precisa de la diferencia de la población.

Valor p

El valor p es la proporción de diferencias entre muestras que son tan extremas como su muestra original cuando usted presupone que la hipótesis nula es verdadera. Un valor p más pequeño proporciona una evidencia más fuerte en contra de la hipótesis nula.

Interpretación

Utilice el valor p para determinar si la diferencia en las medias de las poblaciones es estadísticamente significativa. Para determinar si la diferencia entre las medias de población es estadísticamente significativa, compare el valor p con el nivel de significancia. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una diferencia cuando no hay una diferencia real.
Valor p ≤ α: La diferencia entre las medias es estadísticamente significativa (Rechazar H0)
Si el valor p es menor que o igual al nivel de significancia, la decisión es rechazar la hipótesis nula. Usted puede concluir que la diferencia en las medias de las poblaciones es estadísticamente significativa. Para calcular un intervalo de confianza y determinar si la diferencia es significativa desde el punto de vista práctico, utilice Procedimiento bootstrap para medias de 2 muestras. Para obtener más información, vaya a Significancia estadística y significancia práctica.
Valor p > α: La diferencia entre las medias no es estadísticamente significativa (No puede rechazar H0)
Si el valor p es mayor que el nivel de significancia, la decisión es que no se puede rechazar la hipótesis nula. Usted no tiene suficiente evidencia para concluir que la diferencia entre las medias de las poblaciones es estadísticamente significativa.