Todos los estadísticos y gráficas para Prueba de igualdad de varianzas

Hipótesis nula, Hipótesis alternativa

La prueba de varianzas iguales es una prueba de hipótesis que evalúa dos enunciados mutuamente excluyentes acerca de dos o más desviaciones estándar de población. Estos dos enunciados se denominan hipótesis nula e hipótesis alternativa. Una prueba de hipótesis utiliza los datos de la muestra para determinar si se puede rechazar la hipótesis nula.

Las hipótesis para una prueba de varianzas iguales son las siguientes:
Hipótesis nula (H0)
La hipótesis nula indica que las desviaciones estándar de población son todas iguales.
Hipótesis alternativa (HA)
La hipótesis alternativa indica que no todas las desviaciones estándar de población son iguales.

Interpretación

Compare el valor p con el nivel de significancia para determinar si se rechaza la hipótesis nula.

N

El tamaño de la muestra (N) es el número total de observaciones en cada grupo.

Interpretación

El tamaño de la muestra afecta el intervalo de confianza y la potencia de la prueba.

Generalmente, una muestra más grande produce un intervalo de confianza más estrecho. Con un tamaño de muestra más grande, la prueba también tendrá más potencia para detectar una diferencia.

Desviación estándar (Desv.Est.)

La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos con respecto a la media. El símbolo σ (sigma) suele utilizarse para representar la desviación estándar de una población. El símbolo s se utiliza para representar la desviación estándar de una muestra.

Interpretación

La desviación estándar utiliza las mismas unidades que la variable. Un valor de desviación estándar más alto indica una mayor dispersión de los datos. Una directriz para datos que siguen la distribución normal es que aproximadamente un 68 % de los valores se ubican dentro de una desviación estándar de la media, un 95 % de los valores se ubican dentro de dos desviaciones estándar y un 99.7 % de los valores se ubican dentro de tres desviaciones estándar.

Intervalos de confianza de Bonferroni

Utilice los intervalos de confianza de Bonferroni para estimar la desviación estándar de cada población basándose en sus factores categóricos. Cada intervalo de confianza es un rango de valores que es probable que contenga la desviación estándar de la población correspondiente. Minitab ajusta los intervalos de confianza de Bonferroni para mantener el nivel de confianza simultáneo.

Controlar los intervalos de confianza simultáneos es especialmente importante cuando se evalúan los intervalos de confianza múltiples. Si no se controla el intervalo de confianza simultáneo, la probabilidad de que por lo menos un intervalo de confianza no contenga la desviación estándar aumenta con el número de intervalos de confianza.

Para obtener más información, vaya a Explicación de los niveles de confianza simultáneos e individuales en las comparaciones múltiples y ¿Cuál es el método Bonferroni?

Nota

No se pueden utilizar estos intervalos de confianza de Bonferroni para determinar si las diferencias entre los pares de grupos son estadísticamente significativas. Utilice los valores p y los intervalos de confianza de las comparaciones múltiples en la gráfica de resumen para determinar la significancia estadística de las diferencias.

Interpretación

Método

Hipótesis nulaTodas las varianzas son iguales
Hipótesis alternaPor lo menos una varianza es diferente
Nivel de significanciaα = 0.05

Intervalos de confianza de Bonferroni de 95% para desviaciones estándar

FertilizanteNDesv.Est.IC
GrowFast504.28743(3.43659, 5.61790)
Ninguno505.09137(4.24793, 6.40914)
SuperPlant495.49969(4.48577, 7.08914)
Nivel de confianza individual = 98.3333%

En estos resultados, los intervalos de confianza de Bonferroni de 95 % indican que se puede estar un 95 % seguro de que todo el conjunto de intervalos de confianza incluye las verdaderas desviaciones estándar de población para todos los grupos. También, el nivel de confianza individual indica qué tan seguro se puede estar de que un intervalo de confianza individual contenga la desviación estándar de población de ese grupo específico. Por ejemplo, se puede estar un 98.3333 % seguro de que la desviación estándar para la población GrowFast está dentro del intervalo de confianza (3.43659, 5.6179).

Nivel de confianza individual

El nivel de confianza individual es el porcentaje de veces en que un intervalo de confianza simple incluye la desviación estándar real para ese grupo específico cuando se repite el estudio múltiples veces.

A medida que se incrementa el número de intervalos de confianza en un conjunto, la probabilidad de que por lo menos un intervalo de confianza no contenga la desviación estándar aumenta. El nivel de confianza simultáneo indica hasta que punto se puede estar seguro de que todo el conjunto de intervalos de confianza incluya las verdaderas desviaciones estándar de población para todos los grupos.

Interpretación

Método

Hipótesis nulaTodas las varianzas son iguales
Hipótesis alternaPor lo menos una varianza es diferente
Nivel de significanciaα = 0.05

Intervalos de confianza de Bonferroni de 95% para desviaciones estándar

FertilizanteNDesv.Est.IC
GrowFast504.28743(3.43659, 5.61790)
Ninguno505.09137(4.24793, 6.40914)
SuperPlant495.49969(4.48577, 7.08914)
Nivel de confianza individual = 98.3333%

Se puede estar un 98.3333 % seguro de que cada intervalo de confianza individual contiene la desviación estándar de población para ese grupo específico. Por ejemplo, se puede estar un 98.3333 % seguro de que la desviación estándar para la población GrowFast está dentro del intervalo de confianza (3.43659, 5.61790). Sin embargo, puesto que el conjunto incluye tres intervalos de confianza, solamente se puede estar un 95 % seguro de que todos los intervalos contienen los valores reales.

Pruebas

Los tipos de pruebas para varianzas iguales que Minitab muestra dependen de si seleccionó Utilice la prueba basándose en la distribución normal en el subcuadro de diálogo Opciones y el número de grupos en los datos.

Comparaciones múltiples, métodos de Levene

Si no seleccionó Utilice la prueba basándose en la distribución normal, Minitab muestra los resultados de la prueba tanto para el método de comparaciones múltiples como para el método de Levene. Para la mayoría de las distribuciones continuas, ambos métodos le proporcionan una tasa de error tipo 1 que está cerca del nivel de significancia (conocido como α o alfa). El método de comparaciones múltiples por lo general es más potente. Si el valor p del método de comparaciones múltiples es significativo, puede utilizar la gráfica de resumen para identificar poblaciones específicas que tienen desviaciones estándar que son diferentes entre sí.

Base sus conclusiones en los resultados del método de comparaciones múltiples, a menos que se cumpla lo siguiente:
  • Cada una de las muestras tiene menos de 20 observaciones.
  • La distribución de una o más de las poblaciones es extremadamente asimétrica o tiene colas pesadas. En comparación con la distribución normal, una distribución con colas pesadas tiene más datos en sus extremos inferior y superior.

Si el valor p para la prueba de comparaciones múltiples es menor que el nivel de significancia elegido, las diferencias entre algunas de las desviaciones estándar son estadísticamente significativas. Utilice los intervalos de comparación múltiple para determinar cuáles desviaciones estándar son significativamente diferentes unas de otras. Si dos intervalos no se sobreponen, entonces las desviaciones estándar correspondientes (y las varianzas) son significativamente diferentes.

Cuando se tienen muestras pequeñas de distribuciones muy asimétricas, o distribuciones con colas pesadas, la tasa de error de tipo I para el método de comparaciones múltiples puede ser mayor que α. En estas condiciones, si el método de Levene le proporciona un valor p menor que el del método de comparaciones múltiples, entonces base sus conclusiones en el método de Levene.

Prueba F, prueba de Bartlett

Si selecciona Utilice la prueba basándose en la distribución normal y tiene dos grupos, Minitab realiza la prueba F. Si tiene 3 o más grupos, entonces Minitab realiza la prueba de Bartlett.

La prueba F y la prueba de Bartlett son exactas solo para datos distribuidos normalmente. Cualquier desviación de la normalidad puede hacer que estas pruebas produzcan resultados inexactos. Sin embargo, si los datos se ajustan a la distribución normal, la prueba F y la prueba de Bartlett normalmente son más potentes que el método de comparaciones múltiples o el método de Levene.

Si el valor p para la prueba es menor que el nivel de significancia, las diferencias entre algunas de las desviaciones estándar son estadísticamente significativas.

Estadístico de prueba

Minitab muestra un estadístico de prueba para cada prueba que tenga un estadístico de prueba calculable.
Nota

La prueba de comparaciones múltiples no utiliza un estadístico de prueba.

Interpretación

Minitab utiliza el estadístico de prueba para calcular el valor p, que se utiliza para tomar una decisión acerca de la significancia estadística de las diferencias entre las desviaciones estándar. El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Un estadístico de prueba lo suficientemente alto indica que la diferencia entre algunas de las desviaciones estándar es estadísticamente significativa.

Se puede utilizar el estadístico de prueba para determinar si puede rechazar la hipótesis nula. Sin embargo, el valor p se usa con mayor frecuencia porque es más fácil de interpretar.

Valor p

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Interpretación

Utilice el valor p para determinar si cualquiera de las diferencias entre las desviaciones estándar es estadísticamente significativa. Minitab muestra los resultados de una o dos pruebas que evalúan la igualdad de varianzas. Si tiene dos valores p y no coinciden, véase "Pruebas".

Para determinar si cualquiera de las diferencias entre las desviaciones estándar es estadísticamente significativa, compare el valor p con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula establece que todas las medias grupales son iguales. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una diferencia cuando no hay una diferencia real.

Utilice las siguientes directrices para interpretar los valores p:
  • Si el valor p es > α, las diferencias entre las desviaciones estándar no son estadísticamente significativas.
  • Si el valor p es ≤ α, las diferencias entre algunas de las desviaciones estándar son estadísticamente significativas.

Gráfica de resumen

La gráfica de resumen muestra los valores p y los intervalos de confianza de las pruebas de varianzas iguales. Los tipos de pruebas e intervalos que Minitab muestra dependen de si se seleccionó Utilice la prueba basándose en la distribución normal en el cuadro de diálogo Opciones y en el número de grupos en sus datos.

Si no se seleccionó Utilice la prueba basándose en la distribución normal, la gráfica resumen muestra los valores p tanto para el método de comparaciones múltiples como para el método de Levene. La gráfica también muestra los intervalos de comparaciones múltiples. Se debe elegir entre los dos métodos basándose en las propiedades de los datos.

Si se selecciona Utilice la prueba basándose en la distribución normal y tiene dos grupos, Minitab realiza la prueba F. Si tiene 3 o más grupos, entonces Minitab realiza la prueba de Bartlett. Para cualquiera de estas pruebas, la gráfica también muestra los intervalos de confianza de Bonferroni.

Valores p

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Utilice los valores p para determinar si cualquiera de las diferencias entre las desviaciones estándar es estadísticamente significativa. Minitab muestra los resultados de una o dos pruebas que evalúan la igualdad de varianzas. Si tiene dos valores p y no coinciden, véase la sección "Pruebas" para obtener información sobre cuál de las pruebas utilizar.

Para determinar si cualquiera de las diferencias entre las desviaciones estándar es estadísticamente significativa, compare el valor p con el nivel de significancia para evaluar la hipótesis nula. La hipótesis nula indica que las desviaciones estándar de grupo son todas iguales. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una diferencia cuando no hay una diferencia real.

Utilice las siguientes directrices para interpretar los valores p:
  • Si el valor p es > α, las diferencias entre las desviaciones estándar no son estadísticamente significativas.
  • Si el valor p es ≤ α, las diferencias entre algunas de las desviaciones estándar son estadísticamente significativas.

Intervalos de comparaciones múltiples

Si no se seleccionó Utilice la prueba basándose en la distribución normal, la gráfica de resumen muestra los intervalos de comparaciones múltiples.

Si es válido para usted usar el valor p de comparación múltiple, puede usar los intervalos de confianza de comparación múltiple para identificar los pares específicos de grupos que tienen una diferencia que es estadísticamente significativa. Si dos intervalos no se sobreponen, la diferencia entre las desviaciones estándar correspondiente es estadísticamente significativa.

Si las propiedades de los datos requieren que se use el método Levene, no se evalúan los intervalos de confianza en la gráfica de resumen.

Intervalos de confianza de Bonferroni

Si se selecciona Utilice la prueba basándose en la distribución normal. la gráfica de resumen muestra los intervalos de confianza de Bonferroni.

Utilice los intervalos de confianza de Bonferroni para estimar la desviación estándar de cada población para los factores categóricos. Cada intervalo de confianza es un rango de valores que es probable que contenga la desviación estándar de la población correspondiente. Minitab ajusta los intervalos de confianza de Bonferroni para controlar el nivel de confianza simultáneo.

Controlar los intervalos de confianza simultáneos es especialmente importante cuando se evalúan los intervalos de confianza múltiples. Si no se controla el intervalo de confianza simultáneo, la probabilidad de que por lo menos un intervalo de confianza no contenga la desviación estándar aumenta con el número de intervalos de confianza.

Para obtener más información, vaya a Explicación de los niveles de confianza simultáneos e individuales en las comparaciones múltiples y ¿Cuál es el método Bonferroni?

Nota

No se pueden utilizar estos intervalos de confianza de Bonferroni para determinar si las diferencias entre los pares de grupos son estadísticamente significativas. Utilice los valores p y los intervalos de confianza de las comparaciones múltiples en la gráfica de resumen para determinar la significancia estadística de las diferencias.

Interpretación

En esta gráfica de resumen, el valor p de la prueba de comparaciones múltiples es mayor que el nivel de significancia de 0.05. Ninguna de las diferencias entre los grupos son estadísticamente significativas y todos los intervalos de comparación múltiple se sobreponen.

Gráfica de valores individuales

Una gráfica de valores individuales muestra los valores individuales en cada muestra. La gráfica de valores individuales facilita comparar las muestras. Cada círculo representa una observación. Una gráfica de valores individuales es especialmente útil cuando el tamaño de su muestra es pequeño.

Interpretación

Utilice una gráfica de valores individuales para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de valores individuales funcionan mejor cuando el tamaño de la muestra es menor que 50.

Datos asimétricos

Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Los datos asimétricos indican que los datos podrían no estar distribuidos normalmente. Frecuentemente, es más fácil detectar la asimetría con una gráfica de valores individuales, un histograma o una gráfica de caja.

Asimétrico hacia la derecha
Asimétrico hacia la izquierda

La gráfica de valores individuales con datos asimétricos hacia la derecha muestra tiempos de espera. La mayoría de los tiempos de espera son relativamente cortos y solo unos pocos tiempos de espera son más largos. La gráfica de valores individuales con datos asimétricos hacia la izquierda muestra datos de tiempo de falla. Unos pocos elementos fallan inmediatamente y muchos más fallan posteriormente.

Valores atípicos

Los valores atípicos, que son valores de datos que están muy alejados de otros valores de datos, pueden afectar fuertemente sus resultados. Con frecuencia, los valores atípicos son más fáciles de identificar en una gráfica de valores individuales.

En una gráfica de valores individuales, valores de datos extrañamente bajos o altos indican posibles valores atípicos.

Intente identificar la causa de cualquier valor atípico. Corrija cualesquiera errores de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (causas especiales). A continuación, repita el análisis.

Gráfica de caja

Una gráfica de caja proporciona un resumen gráfico de la distribución de cada muestra. La gráfica de caja permite comparar fácilmente la forma, tendencia central y variabilidad de las muestras.

Interpretación

Utilice una gráfica de caja para examinar la dispersión de los datos y para identificar cualquier posible valor atípico. Las gráficas de caja funcionan mejor cuando el tamaño de la muestra es mayor que 20.

Datos asimétricos

Examine la dispersión de los datos para determinar si los datos parecen ser asimétricos. Cuando los datos son asimétricos, la mayoría de los datos se ubican en la parte superior o inferior de la gráfica. Los datos asimétricos indican que los datos podrían no estar distribuidos normalmente. Frecuentemente, es más fácil detectar la asimetría con una gráfica de valores individuales, un histograma o una gráfica de caja.

Asimétrico hacia la derecha
Asimétrico hacia la izquierda

La gráfica de caja con datos asimétricos hacia la derecha muestra tiempos de espera promedio. La mayoría de los tiempos de espera son relativamente cortos y solo unos pocos de los tiempos de espera son más largos. La gráfica de caja con datos asimétricos hacia la izquierda muestra datos de tasa de falla. Unos pocos elementos fallan inmediatamente y muchos más fallan posteriormente.

Datos marcadamente asimétricos pueden afectar la validez del valor p si su muestra es pequeña (< 20 valores). Si sus datos son marcadamente asimétricos y tiene una muestra pequeña, considere aumentar el tamaño de la muestra.

Valores atípicos

Los valores atípicos, que son valores de datos que están muy alejados de otros valores de datos, pueden afectar fuertemente sus resultados. Frecuentemente, es más fácil identificar los valores atípicos en una gráfica de caja.

En una gráfica de caja, los asteriscos (*) denotan valores atípicos.

Intente identificar la causa de cualquier valor atípico. Corrija cualesquiera errores de entrada de datos o de medición. Considere eliminar los valores de datos asociados con eventos anormales y únicos (causas especiales). A continuación, repita el análisis.