Estadísticos y gráficas de muestra bootstrap para Remuestreo bootstrap para función de 1 muestra

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos y gráficas de muestra bootstrap que se proporcionan con el procedimiento bootstrap para función de 1 muestra.

Histograma

Un histograma divide valores de la muestra entre muchos intervalos y representa la frecuencia de los valores de los datos en cada intervalo con una barra.

Interpretación

Utilice el histograma para examinar la forma de la distribución bootstrap. La distribución bootstrap es la distribución del estadístico elegido de cada muestra repetida. La distribución bootstrap debe parecer normal. Si la distribución bootstrap es no normal, usted no puede confiar en los resultados bootstrap.
50 muestras repetidas
1000 muestras repetidas

La distribución suele ser más fácil de determinar con más muestras repetidas. Por ejemplo, en estos datos, la distribución es ambigua para 50 muestras repetidas. Con 1000 muestras repetidas, la forma parece aproximadamente normal.

En este histograma, la distribución bootstrap parece ser normal. La muestra original solo tiene 16 puntos de datos. Para obtener un intervalo de confianza fiable, usted debe recopilar una muestra más grande y realizar el análisis nuevamente.

Gráfica de valores individuales

Una gráfica de valores individuales muestra los valores individuales en la muestra. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando usted tiene relativamente pocas observaciones y también cuando debe evaluar el efecto de cada observación.

Nota

Minitab muestra una gráfica de valores individuales solamente cuando usted toma solo una muestra repetida. Minitab muestra tanto los datos originales como los datos de la muestra repetidas.

Interpretación

Con un tamaño de la muestra grande, la muestra bootstrap generalmente tendrá un centro y una dispersión similares a la muestra original. Sin embargo, un tamaño de la muestra pequeño puede dar como resultado una muestra bootstrap que no sea similar a la muestra original. Si la muestra bootstrap no se parece a la muestra original, debe considerar aumentar el tamaño de la muestra.
Tamaño de la muestra de 8
Tamaño de la muestra de 50

Gráfica de barras

La gráfica de barras muestra la proporción de ocurrencias de cada categoría.

Nota

Minitab muestra una gráfica de barras cuando usted toma solo una muestra repetida. Minitab muestra tanto los datos originales como los datos de la muestra repetida.

Interpretación

Con un tamaño de muestra grande, la muestra bootstrap generalmente tendrá proporciones similares a la muestra original. Sin embargo, un tamaño de muestra pequeño puede dar como resultado una muestra bootstrap que no sea similar a la muestra original. Si la muestra bootstrap no se parece a la muestra original, debe considerar aumentar el tamaño de la muestra.
Tamaño de muestra de 8
Tamaño de muestra de 50

Número de remuestreos

El número de remuestreos es el número de veces que Minitab toma una muestra aleatoria con reemplazo del conjunto de datos original. Generalmente, un número elevado de remuestreos funciona mejor. El tamaño de la muestra de cada remuestreo es igual al tamaño de la muestra del conjunto de datos original. El número de remuestreos es igual al número de observaciones en el histograma.

Promedio

El promedio es la suma de los estadísticos elegidos en la muestra bootstrap dividida entre el número de muestras repetidas.

Interpretación

Minitab muestra dos valores diferentes para el estadístico elegido, el valor de la muestra observada y el valor de la distribución bootstrap (Promedio). Estos dos valores son una estimación del parámetro de la población y generalmente serán similares. Si hay una diferencia grande entre estos dos valores, usted debería aumentar el tamaño de la muestra de su muestra original.

Puesto que el promedio se basa en los datos de una muestra y no en toda la población, es improbable que el promedio sea igual al parámetro de la población. Para estimar mejor el parámetro de la población, utilice el intervalo de confianza.

Desv.Est. (muestra bootstrap)

La desviación estándar de las muestras bootstrap (también conocida como el error estándar bootstrap) es una estimación de la desviación estándar de la distribución de muestreo del estadístico elegido.

Interpretación

Utilice la desviación estándar para determinar qué tan dispersos están los estadísticos elegidos de la muestra bootstrap con respecto a la media general. Un valor de desviación estándar más alto indica una mayor dispersión.

Utilice la desviación estándar de las muestras bootstrap para determinar con qué precisión el estadístico bootstrap estima el parámetro de la población. Un valor más bajo indica una estimación más precisa del parámetro de la población. Un mayor tamaño de la muestra da como resultado un menor error estándar bootstrap y una estimación más precisa del parámetro de la población.

Intervalo de confianza (IC) y límites

Los intervalos de confianza se basan en la distribución de muestreo de un estadístico. Si un estadístico no tiene sesgo como estimador de un parámetro, su distribución de muestreo se centra en el valor verdadero del parámetro. Una distribución bootstrap se aproxima a la distribución de muestreo del estadístico. Por lo tanto, el 95% intermedio de los valores de la distribución bootstrap proporciona un intervalo de confianza de 95% para el parámetro. El intervalo de confianza ayuda a evaluar la significancia práctica de la estimación del parámetro de la población. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación.

Nota

Minitab no calcula el intervalo de confianza cuando el número de remuestreos es demasiado bajo para obtener un intervalo de confianza preciso.

Muestra observada

VariableNMediaDesv.Est.VarianzaSumaMínimoMedianaMáximo
Tiempo1611.3313.1159.702181.3007.70010.05016.000

Muestras de bootstrap para la media

Número de
remuestreos
MediaDesv.Est.IC de 95% para μ
100011.30950.7625(9.8562, 12.8562)

En estos resultados, la estimación de la diferencia de las poblaciones es aproximadamente 11.3. Usted puede estar 95% seguro de que la media de la población está entre aproximadamente 9.9 y 12.9.