Estadísticos y gráficas de muestra bootstrap para Procedimiento bootstrap para medias de 2 muestras

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos y gráficas de muestra bootstrap que se proporcionan con el procedimiento bootstrap para media de 2 muestras.

Histograma

Un histograma divide valores de la muestra entre muchos intervalos y representa la frecuencia de los valores de los datos en cada intervalo con una barra.

Interpretación

Utilice el histograma para examinar la forma de la distribución bootstrap. La distribución bootstrap es la distribución de la diferencia en las medias de cada muestra repetida. La distribución bootstrap debe parecer normal. Si la distribución bootstrap es no normal, usted no puede confiar en los resultados.
50 muestras repetidas
1000 muestras repetidas

La distribución suele ser más fácil de determinar con más muestras repetidas. Por ejemplo, en estos datos, la distribución es ambigua para 50 muestras repetidas. Con 1000 muestras repetidas, la forma parece aproximadamente normal.

En este histograma, la distribución bootstrap parece ser normal.

Gráfica de valores individuales

Una gráfica de valores individuales muestra los valores individuales en la muestra. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando usted tiene relativamente pocas observaciones y también cuando debe evaluar el efecto de cada observación.

Nota

Minitab muestra una gráfica de valores individuales solamente cuando usted toma solo una muestra repetida. Minitab muestra tanto los datos originales como los datos de la muestra repetida.

Interpretación

Con un tamaño de muestra grande, la muestra bootstrap generalmente tendrá un centro y una dispersión similares a la muestra original. Sin embargo, un tamaño de muestra pequeño puede dar como resultado una muestra bootstrap que no sea similar a la muestra original. Si la muestra bootstrap no se parece a la muestra original, debe considerar aumentar el tamaño de muestra.
Tamaño de la muestra de 8
Tamaño de muestra de 50

Número de remuestreos

El número de remuestreos es el número de veces que Minitab toma una muestra aleatoria con reemplazo del conjunto de datos original. Generalmente, un número elevado de remuestreos funciona mejor. El tamaño de la muestra de cada remuestreo es igual al tamaño de la muestra del conjunto de datos original. El número de remuestreos es igual al número de observaciones en el histograma.

Promedio

El promedio es la suma de todas las diferencias en las medias de la muestra bootstrap dividida entre el número de remuestreos.

Interpretación

Minitab muestra dos valores diferentes para la diferencia en las medias, la diferencia de las muestras observadas y la diferencia de la distribución bootstrap (Promedio). Estos dos valores son una estimación de la diferencia en las medias de las poblaciones y generalmente serán similares. Si hay una diferencia grande entre estos dos valores, usted debería aumentar el tamaño de la muestra de su muestra original.

Puesto que el promedio se basa en los datos de una muestra y no en toda la población, es improbable que el promedio sea igual a la diferencia en las medias de las poblaciones. Para estimar mejor la diferencia en las medias de las poblaciones, utilice el intervalo de confianza.

Desv.Est. (muestra bootstrap)

La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido. Debido a que la desviación estándar utiliza las mismas unidades que los datos, generalmente es más fácil de interpretar que la varianza.

La desviación estándar de las muestras bootstrap (también conocida como el error estándar bootstrap) es una estimación de la desviación estándar de la distribución de muestreo de la diferencia en las medias.

Interpretación

Utilice la desviación estándar para determinar qué tan dispersas están las diferencias de la muestra bootstrap con respecto a la media general de las diferencias. Un valor de desviación estándar más alto indica una mayor dispersión de las diferencias. Una buena regla empírica para una distribución normal es que aproximadamente 68% de los valores se ubican dentro de una desviación estándar de la media general, 95% de los valores se ubican dentro de dos desviaciones estándar y 99.7% de los valores se ubican dentro de tres desviaciones estándar.

Use la desviación estándar de las muestras bootstrap para determinar con qué precisión las diferencias con respecto a la muestra bootstrap estima la diferencia en las medias de población. Un valor más bajo indica una estimación más precisa de la diferencia de la población. Por lo general, una desviación estándar más grande da como resultado un mayor error estándar bootstrap y una estimación menos precisa de la diferencia de la población. Un mayor tamaño de la muestra da como resultado un menor error estándar bootstrap y una estimación más precisa de la diferencia de la población.

Intervalo de confianza (IC) y límites

Los intervalos de confianza se basan en la distribución de muestreo de un estadístico. Si un estadístico no tiene sesgo como estimador de un parámetro, su distribución de muestreo se centra en el valor verdadero del parámetro. Una distribución bootstrap se aproxima a la distribución de muestreo del estadístico. Por lo tanto, el 95% intermedio de los valores de la distribución bootstrap proporciona un intervalo de confianza de 95% para el parámetro. El intervalo de confianza ayuda a evaluar la significancia práctica de la estimación del parámetro de la población. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación.

Nota

Minitab no calcula el intervalo de confianza cuando el número de remuestreos es demasiado bajo para obtener un intervalo de confianza preciso.

Bootstrapping para la diferencia en las medias: Calificación por Hospital

Histograma de bootstrap para Calificación por Hospital

Muestras observadas Hospital N Media Desv.Est. Varianza Mínimo Mediana Máximo A 20 80.30 8.18 66.96 62.00 79.00 98.00 B 20 59.30 12.43 154.54 35.00 58.50 89.00
Diferencia en las muestras observadas Media de A - Media de B = 21
Muestras de bootstrap para la diferencia en las medias Número de IC de 95% para remuestreos Promedio Desv.Est. la diferencia 1000 20.960 3.279 (14.400, 27.600)

En estos resultados, la estimación de la diferencia de las poblaciones es 20.96. Usted puede estar 95% seguro de que la diferencia en las poblaciones está entre 14.4 y 27.6.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política