Un histograma divide valores de la muestra entre muchos intervalos y representa la frecuencia de los valores de los datos en cada intervalo con una barra.
Una gráfica de valores individuales muestra los valores individuales en la muestra. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando usted tiene relativamente pocas observaciones y también cuando debe evaluar el efecto de cada observación.
Minitab muestra una gráfica de valores individuales solamente cuando usted toma solo una muestra repetida. Minitab muestra tanto los datos originales como los datos de la muestra repetida.
El número de remuestreos es el número de veces que Minitab toma una muestra aleatoria con reemplazo del conjunto de datos original. Generalmente, un número elevado de remuestreos funciona mejor. El tamaño de la muestra de cada remuestreo es igual al tamaño de la muestra del conjunto de datos original. El número de remuestreos es igual al número de observaciones en el histograma.
El promedio es la suma de todas las diferencias en las medias de la muestra bootstrap dividida entre el número de remuestreos.
Minitab muestra dos valores diferentes para la diferencia en las medias, la diferencia de las muestras observadas y la diferencia de la distribución bootstrap (Promedio). Estos dos valores son una estimación de la diferencia en las medias de las poblaciones y generalmente serán similares. Si hay una diferencia grande entre estos dos valores, usted debería aumentar el tamaño de la muestra de su muestra original.
Puesto que el promedio se basa en los datos de una muestra y no en toda la población, es improbable que el promedio sea igual a la diferencia en las medias de las poblaciones. Para estimar mejor la diferencia en las medias de las poblaciones, utilice el intervalo de confianza.
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido. Debido a que la desviación estándar utiliza las mismas unidades que los datos, generalmente es más fácil de interpretar que la varianza.
La desviación estándar de las muestras bootstrap (también conocida como el error estándar bootstrap) es una estimación de la desviación estándar de la distribución de muestreo de la diferencia en las medias.
Utilice la desviación estándar para determinar qué tan dispersas están las diferencias de la muestra bootstrap con respecto a la media general de las diferencias. Un valor de desviación estándar más alto indica una mayor dispersión de las diferencias. Una buena regla empírica para una distribución normal es que aproximadamente 68% de los valores se ubican dentro de una desviación estándar de la media general, 95% de los valores se ubican dentro de dos desviaciones estándar y 99.7% de los valores se ubican dentro de tres desviaciones estándar.
Use la desviación estándar de las muestras bootstrap para determinar con qué precisión las diferencias con respecto a la muestra bootstrap estima la diferencia en las medias de población. Un valor más bajo indica una estimación más precisa de la diferencia de la población. Por lo general, una desviación estándar más grande da como resultado un mayor error estándar bootstrap y una estimación menos precisa de la diferencia de la población. Un mayor tamaño de la muestra da como resultado un menor error estándar bootstrap y una estimación más precisa de la diferencia de la población.
Los intervalos de confianza se basan en la distribución de muestreo de un estadístico. Si un estadístico no tiene sesgo como estimador de un parámetro, su distribución de muestreo se centra en el valor verdadero del parámetro. Una distribución bootstrap se aproxima a la distribución de muestreo del estadístico. Por lo tanto, el 95% intermedio de los valores de la distribución bootstrap proporciona un intervalo de confianza de 95% para el parámetro. El intervalo de confianza ayuda a evaluar la significancia práctica de la estimación del parámetro de la población. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación.
Minitab no calcula el intervalo de confianza cuando el número de remuestreos es demasiado bajo para obtener un intervalo de confianza preciso.
Hospital | N | Media | Desv.Est. | Varianza | Mínimo | Mediana | Máximo |
---|---|---|---|---|---|---|---|
A | 20 | 80.30 | 8.18 | 66.96 | 62.00 | 79.00 | 98.00 |
B | 20 | 59.30 | 12.43 | 154.54 | 35.00 | 58.50 | 89.00 |
Media de A - Media de B = 21 |
---|
Número de remuestreos | Promedio | Desv.Est. | IC de 95% para la diferencia |
---|---|---|---|
1000 | 20.960 | 3.279 | (14.400, 27.600) |
En estos resultados, la estimación de la diferencia de las poblaciones es 20.96. Usted puede estar 95% seguro de que la diferencia en las poblaciones está entre 14.4 y 27.6.