Interpretar todos los estadísticos para Prueba chi-cuadrada para asociación

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos que se proporcionan con la prueba de chi-cuadrada de asociación.

Conteos observados y esperados

El conteo observado es el número real de observaciones en una muestra que pertenecen a una categoría.

El conteo esperado es la frecuencia que se esperaría en una celda, en promedio, si las variables fueran independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.

Interpretación

Usted puede comparar los valores observados y los valores esperados de cada celda de la tabla de salida. En estos resultados, el conteo observado de celda es el primer número en cada celda y el conteo esperado es el segundo número en cada celda.

Si dos variables están asociadas, entonces la distribución de las observaciones de una variable diferirá dependiendo de la categoría de la segunda variable. Si dos variables son independientes, entonces la distribución de las observaciones de una variable será similar para todas las categorías de la segunda variable. En este ejemplo, en la columna 1, fila 2 de la tabla, el conteo observado es 76 y el conteo esperado es 60.78. El conteo observado parece ser mucho más grande de lo que se podría esperar si las variables fueran independientes.

Filas: Máquina   Columnas: Columnas de la hoja de trabajo

1er turno2do turno3er turnoTodo
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
Todo160134114408
Contenido de la celda
      Conteo
      Conteo esperado
      Residuos estandarizados

Todos los conteos de fila y columna

Minitab muestra los conteos marginales de filas y columnas.
Conteos de fila
La suma de los conteos de cada fila de la tabla.
Conteos de columna
La suma de los conteos de cada columna de la tabla.
Total
La suma de los conteos de todas las celdas. La suma de todos los conteos de fila es igual a la suma de todos los conteos de columna.

Interpretación

Utilice los conteos marginales para entender cómo están distribuidos los conteos entre las categorías.

En estos resultados, el total de la fila 1 es 143, el total de la fila 2 es 155, y el total de la fila 3 es 110. La suma de todas las filas es 408. El total de la columna 1 es 160, el total de la columna 2 es 134 y el total de la columna 3 es 114. La suma de todas las columnas es 408.

Filas: Máquina   Columnas: Columnas de la hoja de trabajo

1er turno2do turno3er turnoTodo
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
Todo160134114408
Contenido de la celda
      Conteo
      Conteo esperado
      Residuos estandarizados

Contribución a chi-cuadrada

Minitab muestra la contribución de cada celda al estadístico de chi-cuadrada, que cuantifica qué tanto del estadístico total de chi-cuadrada es atribuible a la divergencia de cada celda.

Minitab calcula la contribución de cada celda al estadístico de chi-cuadrada como el cuadrado de la diferencia entre los valores observados y esperados para una celda, dividido entre el valor esperado para esa celda. El estadístico de chi-cuadrada es la suma de estos valores para todas las celdas.

Interpretación

En estos resultados, la suma de la chi-cuadrada de cada celda es el estadístico de chi-cuadrada de Pearson, que es 11.788. Las contribuciones más grandes son de la máquina 2, en el 1er y 3er turno. Las contribuciones más pequeñas son del 2do turno, en las máquinas 1 y 2.

Filas: Máquina   Columnas: Columnas de la hoja de trabajo

1er turno2do turno3er turnoTodo
         
1484748143
  56.0846.9739.96 
  1.16370.00001.6195 
         
2764732155
  60.7850.9143.31 
  3.80880.29982.9530 
         
3364034110
  43.1436.1330.74 
  1.18090.41510.3468 
         
Todo160134114408
Contenido de la celda
      Conteo
      Conteo esperado
      Contribución a Chi-cuadrada

Prueba de chi-cuadrada

Chi-cuadradaGLValor p
Pearson11.78840.019
Relación de verosimilitud11.81640.019

Chi-cuadrada de Pearson y chi-cuadrada de relación de verosimilitud

Minitab realiza una prueba de chi-cuadrada de Pearson y una prueba de chi-cuadrada de relación de verosimilitud. Cada prueba de chi-cuadrada se puede usar para determinar si las variables están o no están asociadas (dependencia).
Prueba de chi-cuadrada de Pearson

El estadístico de chi-cuadrada de Pearson (X2) se basa en la diferencia al cuadrado entre las frecuencias observadas y las esperadas.

Prueba de chi-cuadrada de relación de verosimilitud

El estadístico de chi-cuadrada de relación de verosimilitud (G2) se basa en la relación de frecuencias observadas a frecuencias esperadas.

Interpretación

Utilice los estadísticos de chi-cuadrada para comprobar si las variables están asociadas.

En estos resultados, ambos estadísticos de chi-cuadrada son muy similares. Utilice los valores p para evaluar la significancia de los estadísticos de chi-cuadrada.

Prueba de chi-cuadrada

Chi-cuadradaGLValor p
Pearson11.78840.019
Relación de verosimilitud11.81640.019

Cuando los conteos esperados son pequeños, los resultados pueden ser engañosos. Para obtener más información, consulte Consideraciones acerca de los datos para Prueba chi-cuadrada para asociación

GL

Los grados de libertad (GL) son el número de informaciones independientes sobre un estadístico. Los grados de libertad de una tabla son iguales a (número de filas – 1), multiplicado por (número de columnas – 1).

Interpretación

Minitab utiliza los grados de libertad para determinar el valor p asociado al estadístico de prueba.

En estos resultados, los grados de libertad (GL) son 4.

Prueba de chi-cuadrada

Chi-cuadradaGLValor p
Pearson11.78840.019
Relación de verosimilitud11.81640.019

Valor p

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Utilice el valor p para determinar si puede o no puede rechazar la hipótesis nula, que dice que no existe ninguna asociación entre dos variables categóricas.

Minitab utiliza el estadístico de chi-cuadrada para determinar el valor p.

Nota

Minitab no muestra el valor p cuando cualquier conteo esperado es menor que 1, porque los resultados podrían no ser válidos.

Interpretación

Para determinar si las variables son independientes, compare el valor p con el nivel de significancia. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación entre las variables cuando no hay una asociación real.
Valor p ≤ α: Las variables tienen una asociación estadísticamente significativa (Rechazar H0)
Si el valor p es menor que o igual al nivel de significancia, usted rechaza la hipótesis nula y concluye que hay una asociación estadísticamente significativa entre las variables.
Valor p > α: No se puede concluir que las variables están asociadas (No se puede rechazar H0)
Si el valor p es mayor que el nivel de significancia, usted no puede rechazar la hipótesis nula, porque no hay suficiente evidencia para concluir que las variables están asociadas.

En estos resultados, valor p = 0.019. Puesto que el valor p es menor que α, usted rechaza la hipótesis nula. Usted puede concluir que las variables están asociadas.

Prueba de chi-cuadrada

Chi-cuadradaGLValor p
Pearson11.78840.019
Relación de verosimilitud11.81640.019

Residuos sin procesar

Los residuos sin procesar son las diferencias entre los conteos observados y los conteos esperados.
Conteo observado
El conteo observado es el número real de observaciones en una muestra que pertenecen a una categoría.
Conteo esperado

El conteo esperado es la frecuencia que se esperaría en una celda, en promedio, si las variables fueran independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.

Interpretación

Usted puede comparar los valores observados y los valores esperados en la tabla de salida.

En estos resultados, el conteo de celda es el primer número en cada celda, el conteo esperado es el segundo número en cada celda y el residuo sin procesar es el tercer número en cada celda. Máquina 2, 1er turno tiene el residuo sin procesar más grande, lo que significa que la mayor diferencia entre los defectos esperados y reales se encuentra en la máquina 2 durante el 1er turno.

Filas: Máquina   Columnas: Columnas de la hoja de trabajo

1er turno2do turno3er turnoTodo
         
1484748143
  56.0846.9739.96 
  -8.0780.0348.044 
         
2764732155
  60.7850.9143.31 
  15.216-3.907-11.309 
         
3364034110
  43.1436.1330.74 
  -7.1373.8733.265 
         
Todo160134114408
Contenido de la celda
      Conteo
      Conteo esperado
      Residuo
Una mejor manera de comparar los conteos observados y los conteos esperados es con los residuos estandarizados.

Residuos estandarizados

Los residuos estandarizados son los residuos sin procesar (o la diferencia entre los conteos observados y los conteos esperados), divididos entre la raíz cuadrada de los conteos esperados.

Interpretación

Usted puede comparar los residuos estandarizados en la tabla de salida para ver qué categoría de variables presenta la mayor diferencia entre los conteos esperados y los conteos reales en relación con el tamaño de la muestra y parecen ser dependientes. Por ejemplo, puede evaluar los residuos estandarizados de la tabla de salida para ver la asociación entre la máquina y el turno para producir defectos.

En estos resultados, el conteo de celda es el primer número en cada celda, el conteo esperado es el segundo número en cada celda y el residuo estandarizado es el tercer número en cada celda. Los residuos estandarizados positivos indican que había más mangos defectuosos de lo esperado. Los residuos estandarizados negativos indican que había menos mangos defectuosos de lo esperado.

Filas: Máquina   Columnas: Columnas de la hoja de trabajo

1er turno2do turno3er turnoTodo
         
1484748143
  56.0846.9739.96 
  -1.07880.00501.2726 
         
2764732155
  60.7850.9143.31 
  1.9516-0.5476-1.7184 
         
3364034110
  43.1436.1330.74 
  -1.08670.64430.5889 
         
Todo160134114408
Contenido de la celda
      Conteo
      Conteo esperado
      Residuos estandarizados

Residuos ajustados

Los residuos ajustados son los residuos sin procesar (o la diferencia entre los conteos observados y los conteos esperados) divididos entre una estimación del error estándar. Utilice los residuos ajustados para explicar la variación debido al tamaño de la muestra.

Interpretación

Usted puede comparar los residuos ajustados en la tabla de salida para ver qué categorías presentan la mayor diferencia entre los conteos esperados y los conteos reales en relación con el tamaño de la muestra. Por ejemplo, puede ver qué máquina o turno presenta la mayor diferencia entre el número esperado de unidades defectuosas y el número real de unidades defectuosas.

En estos resultados, el conteo de celda es el primer número en cada celda, el conteo esperado es el segundo número en cada celda y el residuo ajustado es el tercer número en cada celda. Los residuos ajustados positivos indican que había más mangos defectuosos de lo esperado, ajustados para el tamaño de la muestra. Los residuos ajustados negativos indican que había menos mangos defectuosos de lo esperado, ajustados para el tamaño de la muestra.

Filas: Máquina   Columnas: Columnas de la hoja de trabajo

1er turno2do turno3er turnoTodo
         
1484748143
  56.0846.9739.96 
  -1.71690.00761.8602 
         
2764732155
  60.7850.9143.31 
  3.1788-0.8485-2.5707 
         
3364034110
  43.1436.1330.74 
  -1.63090.91990.8117 
         
Todo160134114408
Contenido de la celda
      Conteo
      Conteo esperado
      Residuo ajustado