En la salida, las hipótesis nula y alternativa le ayudan a verificar que usted ingresó el valor correcto de la relación hipotética.
El nivel de significancia (denotado como α o alfa) es el máximo nivel de riesgo aceptable de rechazar la hipótesis nula cuando la hipótesis nula es verdadera (error tipo I). Por lo general, usted elige el nivel de significancia antes de analizar los datos. En Minitab, puede elegir el nivel de significancia especificando el nivel de confianza, porque el nivel de significancia es igual a 1 menos el nivel de confianza. Puesto que el nivel de confianza predeterminado en Minitab es 0.95, el nivel de significancia predeterminado es 0.05.
Compare el nivel de significancia con el valor p para decidir si puede rechazar o no la hipótesis nula (H0). Si el valor p es menor que el nivel de significancia, la interpretación habitual es que los resultados son estadísticamente significativos y usted rechaza H0.
El tamaño de la muestra (N) es el número total de observaciones en la muestra.
El tamaño de la muestra afecta el intervalo de confianza y la potencia de la prueba.
Generalmente, un tamaño de la muestra más grande da como resultado un intervalo de confianza más estrecho. Con un tamaño de la muestra más grande, la prueba también tendrá más potencia para detectar una diferencia. Para obtener más información, vaya a ¿Qué es potencia?.
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido.
La desviación estándar utiliza las mismas unidades que los datos.
La desviación estándar de cada muestra es una estimación de la desviación estándar de cada población. Minitab utiliza la desviación estándar para estimar la relación en las desviaciones estándar de las poblaciones. Usted debe concentrarse en esta relación.
La varianza mide qué tan dispersos están los datos alrededor de su media. La varianza es igual a la desviación estándar elevada al cuadrado.
La varianza de cada muestra es una estimación de la varianza de cada población. Minitab utiliza las varianzas para estimar la relación en las varianzas de las poblaciones. Usted debe concentrarse en esta relación.
La relación de las desviaciones estándar es la desviación estándar de la primera muestra dividida entre la desviación estándar de la segunda muestra.
La relación estimada de las desviaciones estándar de los datos de la muestra es una estimación de la relación en las desviaciones estándar de las poblaciones.
Puesto que la relación estimada se basa en los datos de una muestra y no en toda la población, es improbable que la relación de las muestras sea igual a la relación de las poblaciones. Para estimar mejor la relación, utilice el intervalo de confianza.
La relación de las varianzas es la varianza de la primera muestra dividida entre la varianza de la segunda muestra.
La relación estimada de las varianzas de los datos de la muestra es una estimación de la relación en las varianzas de las poblaciones.
Puesto que la relación estimada se basa en los datos de una muestra y no en toda la población, es improbable que la relación de las muestras sea igual a la relación de las poblaciones. Para estimar mejor la relación, utilice el intervalo de confianza.
El intervalo de confianza proporciona un rango de valores probables para la relación de población. Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces la muestra, un determinado porcentaje de los intervalos o bordes de confianza resultantes contendría la relación de población desconocida. El porcentaje de estos intervalos o bordes de confianza que contiene la relación es el nivel de confianza del intervalo. Por ejemplo, un nivel de confianza de 95% indica que si usted toma 100 muestras aleatorias de la población, podría esperar que aproximadamente 95 de las muestras produzcan intervalos que contengan la relación de población.
Un borde superior define un valor en comparación con el cual es probable que la relación de población sea menor. Un borde inferior define un valor en comparación con el cual es probable que la relación de población sea mayor.
El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra. Para obtener más información, vaya a Maneras de obtener un intervalo de confianza más preciso.
Por opción predeterminada, la prueba de 2 varianzas muestra los resultados del método de Levene y del método de Bonett. El método de Bonett es por lo general más fiable que el método de Levene. Sin embargo, para distribuciones con asimetría extrema y colas pesadas, el método de Levene suele ser más fiable que el método de Bonett. Utilice la prueba F solo si usted está seguro de que los datos siguen una distribución normal. Cualquier desviación pequeña con respecto a la normalidad puede afectar considerablemente los resultados de la prueba F. Para obtener más información, vaya a ¿Debería usar el método de Bonett o el método de Levene para 2 varianzas?.
Relación estimada | IC de 95% para la relación usando Bonett | IC de 95% para la relación usando Levene |
---|---|---|
0.658241 | (0.372, 1.215) | (0.378, 1.296) |
En estos resultados, la estimación de la relación de las desviaciones estándar de las poblaciones para las calificaciones de dos hospitales es 0,658. Al utilizar el método de Bonett, usted puede estar 95% seguro de que la relación de las desviaciones estándar de las poblaciones para las calificaciones de los hospitales está entre 0,372 y 1,215.
Los grados de libertad (GL) son la cantidad de información suministrada por sus datos que usted puede "gastar" para estimar los valores de parámetros de población desconocidos y calcular la variabilidad de esas estimaciones. Para una prueba de 2 varianzas, los grados de libertad se determinan según el número de observaciones en la muestra y también dependen del método que Minitab utiliza.
Minitab utiliza los grados de libertad para determinar el estadístico de prueba. Los grados de libertad se determinan según el tamaño de la muestra. Si incrementa el tamaño de la muestra, obtendrá más información sobre la población, con lo cual aumentan los grados de libertad.
El estadístico de prueba es un estadístico que Minitab calcula para el método de Bonett invirtiendo el intervalo de confianza. El estadístico de prueba para el método de Bonett no está disponible para datos resumidos ni para datos que no estén balanceados.
Usted puede comparar el estadístico de prueba con valores críticos de la distribución de chi-cuadrada para determinar si puede rechazar la hipótesis nula. Sin embargo, por lo general es más práctico y conveniente utilizar el valor p de la prueba para hacer la misma determinación. El valor p tiene el mismo significado para pruebas de cualquier tamaño, pero el mismo estadístico de chi-cuadrada puede indicar conclusiones opuestas dependiendo del tamaño de la muestra.
El estadístico de prueba se utiliza para calcular el valor p.
La prueba utiliza el estadístico F de ANOVA de un solo factor aplicado a la desviación de la mediana absoluta de las observaciones. Por lo tanto, aplicar el método de Levene es equivalente a aplicar el procedimiento de ANOVA de un solo factor a la desviación de la mediana absoluta de las observaciones. Para problemas de 2 muestras, este método también es equivalente a aplicar el procedimiento t de 2 muestras a la desviación de la mediana absoluta de las observaciones.
Usted puede comparar el estadístico de prueba con valores críticos de la distribución F para determinar si puede rechazar la hipótesis nula. Sin embargo, por lo general es más práctico y conveniente utilizar el valor p de la prueba para hacer la misma determinación.
El estadístico de prueba se utiliza para calcular el valor p.
El estadístico de prueba es un estadístico para las pruebas F que mide la relación entre las varianzas observadas.
Usted puede comparar el estadístico de prueba con valores críticos de la distribución F para determinar si puede rechazar la hipótesis nula. Sin embargo, por lo general es más práctico y conveniente utilizar el valor p de la prueba para hacer la misma determinación.
El estadístico de prueba se utiliza para calcular el valor p.
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Un valor p más pequeño proporciona una evidencia más fuerte en contra de la hipótesis nula.
Utilice el valor p para determinar si la diferencia en las desviaciones estándar o varianzas de las poblaciones es estadísticamente significativa.
Para obtener más información, vaya a ¿Debería usar el método de Bonett o el método de Levene para 2 varianzas?.
La gráfica de resumen muestra intervalos de confianza de la relación e intervalos de confianza de las desviaciones estándar o varianzas de cada muestra. La gráfica de resumen también muestra gráficas de caja de los datos de la muestra y los valores p de las pruebas de hipótesis.
El intervalo de confianza proporciona un rango de valores probables para la relación de población. Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces la muestra, un determinado porcentaje de los intervalos o bordes de confianza resultantes contendría la relación de población desconocida. El porcentaje de estos intervalos o bordes de confianza que contiene la relación es el nivel de confianza del intervalo. Por ejemplo, un nivel de confianza de 95% indica que si usted toma 100 muestras aleatorias de la población, podría esperar que aproximadamente 95 de las muestras produzcan intervalos que contengan la relación de población.
Un borde superior define un valor en comparación con el cual es probable que la relación de población sea menor. Un borde inferior define un valor en comparación con el cual es probable que la relación de población sea mayor.
El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra. Para obtener más información, vaya a Maneras de obtener un intervalo de confianza más preciso.
Por opción predeterminada, la prueba de 2 varianzas muestra los resultados del método de Levene y del método de Bonett. El método de Bonett es por lo general más fiable que el método de Levene. Sin embargo, para distribuciones con asimetría extrema y colas pesadas, el método de Levene suele ser más fiable que el método de Bonett. Utilice la prueba F solo si usted está seguro de que los datos siguen una distribución normal. Cualquier desviación pequeña con respecto a la normalidad puede afectar considerablemente los resultados de la prueba F. Para obtener más información, vaya a ¿Debería usar el método de Bonett o el método de Levene para 2 varianzas?.
Una gráfica de caja proporciona un resumen gráfico de la distribución de cada muestra. La gráfica de caja permite comparar fácilmente la forma, tendencia central y variabilidad de las muestras.
Utilice una gráfica de caja para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de caja funcionan mejor cuando el tamaño de la muestra es mayor que 20.
Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Con frecuencia, es fácil detectar la asimetría con un histograma o una gráfica de caja.
Los datos marcadamente asimétricos pueden afectar la validez del valor p si la muestra es pequeña (cualquiera de las muestras tiene menos de 20 valores). Si los datos son marcadamente asimétricos y usted tiene una muestra pequeña, considere aumentar el tamaño de la muestra.
Los valores atípicos, que son valores de datos que están muy distantes de otros valores de datos, pueden afectar considerablemente los resultados de un análisis. Con frecuencia, es fácil identificar los valores atípicos en una gráfica de caja.
Trate de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (también conocidos como causas especiales). Luego, repita el análisis. Para obtener más información, vaya a Identificar valores atípicos.
Una gráfica de valores individuales muestra los valores individuales en cada muestra. Una gráfica de valores individuales permite comparar fácilmente las muestras. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando usted tiene relativamente pocas observaciones y cuando también necesita evaluar el efecto de cada observación.
Utilice una gráfica de valores individuales para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de valores individuales funcionan mejor cuando el tamaño de la muestra es menor que 50.
Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Con frecuencia, es fácil detectar la asimetría con un histograma o una gráfica de caja.
Los datos marcadamente asimétricos pueden afectar la validez del valor p si la muestra es pequeña (cualquiera de las muestras tiene menos de 20 valores). Si los datos son marcadamente asimétricos y usted tiene una muestra pequeña, considere aumentar el tamaño de la muestra.
Los valores atípicos, que son valores de datos que están muy distantes de otros valores de datos, pueden afectar considerablemente los resultados de un análisis. Con frecuencia, es fácil identificar los valores atípicos en una gráfica de caja.
Trate de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (también conocidos como causas especiales). Luego, repita el análisis. Para obtener más información, vaya a Identificar valores atípicos.
Un histograma divide los valores de la muestra en muchos intervalos y representa la frecuencia de los valores de datos en cada intervalo con una barra.
Utilice un histograma para evaluar la forma y dispersión de los datos. Los histogramas funcionan mejor cuando el tamaño de la muestra es mayor que 20.
Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Con frecuencia, es fácil detectar la asimetría con un histograma o una gráfica de caja.
Los datos marcadamente asimétricos pueden afectar la validez del valor p si la muestra es pequeña (cualquiera de las muestras tiene menos de 20 valores). Si los datos son marcadamente asimétricos y usted tiene una muestra pequeña, considere aumentar el tamaño de la muestra.
Los valores atípicos, que son valores de datos que están muy distantes de otros valores de datos, pueden afectar considerablemente los resultados de un análisis. Con frecuencia, es fácil identificar los valores atípicos en una gráfica de caja.
Trate de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (también conocidos como causas especiales). Luego, repita el análisis. Para obtener más información, vaya a Identificar valores atípicos.