Interpretar todos los estadísticos para Prueba de chi-cuadrada para asociación

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos que se proporcionan con la prueba de chi-cuadrada de asociación.

Conteos observados y esperados

El conteo observado es el número real de observaciones en una muestra que pertenecen a una categoría.

El conteo esperado es la frecuencia que se esperaría en una celda, en promedio, si las variables fueran independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.

Interpretación

Usted puede comparar los valores observados y los valores esperados de cada celda de la tabla de salida. En estos resultados, el conteo observado de celda es el primer número en cada celda y el conteo esperado es el segundo número en cada celda.

Si dos variables están asociadas, entonces la distribución de las observaciones de una variable diferirá dependiendo de la categoría de la segunda variable. Si dos variables son independientes, entonces la distribución de las observaciones de una variable será similar para todas las categorías de la segunda variable. En este ejemplo, en la columna 1, fila 2 de la tabla, el conteo observado es 76 y el conteo esperado es 60.78. El conteo observado parece ser mucho más grande de lo que se podría esperar si las variables fueran independientes.

Estadísticas tabuladas: Máquina, Columnas de la hoja de trabajo

Filas: Máquina Columnas: Columnas de la hoja de trabajo 1er turno 2do turno 3er turno Todo 1 48 47 48 143 56.08 46.97 39.96 2 76 47 32 155 60.78 50.91 43.31 3 36 40 34 110 43.14 36.13 30.74 Todo 160 134 114 408 Contenido de la celda Conteo Conteo esperado

Todos los conteos de fila y columna

Minitab muestra los conteos marginales de filas y columnas.
Conteos de fila
La suma de los conteos de cada fila de la tabla.
Conteos de columna
La suma de los conteos de cada columna de la tabla.
Total
La suma de los conteos de todas las celdas. La suma de todos los conteos de fila es igual a la suma de todos los conteos de columna.

Interpretación

Utilice los conteos marginales para entender cómo están distribuidos los conteos entre las categorías.

En estos resultados, el total de la fila 1 es 143, el total de la fila 2 es 155, y el total de la fila 3 es 110. La suma de todas las filas es 408. El total de la columna 1 es 160, el total de la columna 2 es 134 y el total de la columna 3 es 114. La suma de todas las columnas es 408.

Estadísticas tabuladas: Máquina, Columnas de la hoja de trabajo

Filas: Máquina Columnas: Columnas de la hoja de trabajo 1er turno 2do turno 3er turno Todo 1 48 47 48 143 56.08 46.97 39.96 2 76 47 32 155 60.78 50.91 43.31 3 36 40 34 110 43.14 36.13 30.74 Todo 160 134 114 408 Contenido de la celda Conteo Conteo esperado

Contribución a chi-cuadrada

Minitab muestra la contribución de cada celda al estadístico de chi-cuadrada, que cuantifica qué tanto del estadístico total de chi-cuadrada es atribuible a la divergencia de cada celda.

Minitab calcula la contribución de cada celda al estadístico de chi-cuadrada como el cuadrado de la diferencia entre los valores observados y esperados para una celda, dividido entre el valor esperado para esa celda. El estadístico de chi-cuadrada es la suma de estos valores para todas las celdas.

Interpretación

En estos resultados, la suma de la chi-cuadrada de cada celda es el estadístico de chi-cuadrada de Pearson, que es 11.788. Las contribuciones más grandes son de la máquina 2, en el 1er y 3er turno. Las contribuciones más pequeñas son del 2do turno, en las máquinas 1 y 2.

Prueba chi-cuadrada para asociación: Máquina, Columnas de la hoja de trabajo

Filas: Máquina Columnas: Columnas de la hoja de trabajo 1er turno 2do turno 3er turno Todo 1 48 47 48 143 56.08 46.97 39.96 1.1637 0.0000 1.6195 2 76 47 32 155 60.78 50.91 43.31 3.8088 0.2998 2.9530 3 36 40 34 110 43.14 36.13 30.74 1.1809 0.4151 0.3468 Todo 160 134 114 408 Contenido de la celda Conteo Conteo esperado Contribución a Chi-cuadrada
Prueba de chi-cuadrada Chi-cuadrada GL Valor p Pearson 11.788 4 0.019 Relación de verosimilitud 11.816 4 0.019

Chi-cuadrada de Pearson y chi-cuadrada de relación de verosimilitud

Minitab realiza una prueba de chi-cuadrada de Pearson y una prueba de chi-cuadrada de relación de verosimilitud. Cada prueba de chi-cuadrada se puede usar para determinar si las variables están o no están asociadas (dependencia).
Prueba de chi-cuadrada de Pearson

El estadístico de chi-cuadrada de Pearson (X2) se basa en la diferencia al cuadrado entre las frecuencias observadas y las esperadas.

Prueba de chi-cuadrada de relación de verosimilitud

El estadístico de chi-cuadrada de relación de verosimilitud (G2) se basa en la relación de frecuencias observadas a frecuencias esperadas.

Interpretación

Utilice los estadísticos de chi-cuadrada para comprobar si las variables están asociadas.

En estos resultados, ambos estadísticos de chi-cuadrada son muy similares. Utilice los valores p para evaluar la significancia de los estadísticos de chi-cuadrada.
Prueba de chi-cuadrada Chi-cuadrada GL Valor p Pearson 11.788 4 0.019 Relación de verosimilitud 11.816 4 0.019

Cuando los conteos esperados son pequeños, los resultados pueden ser engañosos. Para obtener más información, consulte Consideraciones acerca de los datos para Prueba de chi-cuadrada para asociación

GL

Los grados de libertad (GL) son el número de informaciones independientes sobre un estadístico. Los grados de libertad de una tabla son iguales a (número de filas – 1), multiplicado por (número de columnas – 1).

Interpretación

Minitab utiliza los grados de libertad para determinar el valor p asociado al estadístico de prueba.

En estos resultados, los grados de libertad (GL) son 4.
Prueba de chi-cuadrada Chi-cuadrada GL Valor p Pearson 11.788 4 0.019 Relación de verosimilitud 11.816 4 0.019

Valor p

El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.

Utilice el valor p para determinar si puede o no puede rechazar la hipótesis nula, que dice que no existe ninguna asociación entre dos variables categóricas.

Minitab utiliza el estadístico de chi-cuadrada para determinar el valor p.

Nota

Minitab no muestra el valor p cuando cualquier conteo esperado es menor que 1, porque los resultados podrían no ser válidos.

Interpretación

Para determinar si las variables son independientes, compare el valor p con el nivel de significancia. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una asociación entre las variables cuando no hay una asociación real.
Valor p ≤ α: Las variables tienen una asociación estadísticamente significativa (Rechazar H0)
Si el valor p es menor que o igual al nivel de significancia, usted rechaza la hipótesis nula y concluye que hay una asociación estadísticamente significativa entre las variables.
Valor p > α: No se puede concluir que las variables están asociadas (No se puede rechazar H0)
Si el valor p es mayor que el nivel de significancia, usted no puede rechazar la hipótesis nula, porque no hay suficiente evidencia para concluir que las variables están asociadas.
En estos resultados, valor p = 0.019. Puesto que el valor p es menor que α, usted rechaza la hipótesis nula. Usted puede concluir que las variables están asociadas.
Prueba de chi-cuadrada Chi-cuadrada GL Valor p Pearson 11.788 4 0.019 Relación de verosimilitud 11.816 4 0.019

Residuos sin procesar

Los residuos sin procesar son las diferencias entre los conteos observados y los conteos esperados.
Conteo observado
El conteo observado es el número real de observaciones en una muestra que pertenecen a una categoría.
Conteo esperado

El conteo esperado es la frecuencia que se esperaría en una celda, en promedio, si las variables fueran independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.

Interpretación

Usted puede comparar los valores observados y los valores esperados en la tabla de salida.

En estos resultados, el conteo de celda es el primer número en cada celda, el conteo esperado es el segundo número en cada celda y el residuo sin procesar es el tercer número en cada celda. Máquina 2, 2do turno tiene el residuo sin procesar más grande, lo que significa que la mayor diferencia entre los defectos esperados y reales se encuentra en la máquina 2 durante el 2do turno.
Filas: Máquina Columnas: Columnas de la hoja de trabajo 1er turno 2do turno 3er turno Todo 1 48 47 48 143 56.08 46.97 39.96 -8.078 0.034 8.044 2 76 47 32 155 60.78 50.91 43.31 15.216 -3.907 -11.309 3 36 40 34 110 43.14 36.13 30.74 -7.137 3.873 3.265 Todo 160 134 114 408 Contenido de la celda Conteo Conteo esperado Residuo
Una mejor manera de comparar los conteos observados y los conteos esperados es con los residuos estandarizados.

Residuos estandarizados

Los residuos estandarizados son los residuos sin procesar (o la diferencia entre los conteos observados y los conteos esperados), divididos entre la raíz cuadrada de los conteos esperados.

Interpretación

Usted puede comparar los residuos estandarizados en la tabla de salida para ver qué categoría de variables presenta la mayor diferencia entre los conteos esperados y los conteos reales en relación con el tamaño de la muestra y parecen ser dependientes. Por ejemplo, puede evaluar los residuos estandarizados de la tabla de salida para ver la asociación entre la máquina y el turno para producir defectos.

En estos resultados, el conteo de celda es el primer número en cada celda, el conteo esperado es el segundo número en cada celda y el residuo estandarizado es el tercer número en cada celda. Los residuos estandarizados positivos indican que había más mangos defectuosos de lo esperado. Los residuos estandarizados negativos indican que había menos mangos defectuosos de lo esperado.
Rows: Machine ID Columns: Worksheet columns 1st shift 2nd shift 3rd shift All 1 48 47 48 143 56.08 46.97 39.96 -1.0788 0.0050 1.2726 2 76 47 32 155 60.78 50.91 43.31 1.9516 -0.5476 -1.7184 3 36 40 34 110 43.14 36.13 30.74 -1.0867 0.6443 0.5889 All 160 134 114 408 Cell Contents: Count Expected count Standardized residual

Residuos ajustados

Los residuos ajustados son los residuos sin procesar (o la diferencia entre los conteos observados y los conteos esperados) divididos entre una estimación del error estándar. Utilice los residuos ajustados para explicar la variación debido al tamaño de la muestra.

Interpretación

Usted puede comparar los residuos ajustados en la tabla de salida para ver qué categorías presentan la mayor diferencia entre los conteos esperados y los conteos reales en relación con el tamaño de la muestra. Por ejemplo, puede ver qué máquina o turno presenta la mayor diferencia entre el número esperado de unidades defectuosas y el número real de unidades defectuosas.

En estos resultados, el conteo de celda es el primer número en cada celda, el conteo esperado es el segundo número en cada celda y el residuo ajustado es el tercer número en cada celda. Los residuos ajustados positivos indican que había más mangos defectuosos de lo esperado, ajustados para el tamaño de la muestra. Los residuos ajustados negativos indican que había menos mangos defectuosos de lo esperado, ajustados para el tamaño de la muestra.
Filas: Máquina Columnas: Columnas de la hoja de trabajo 1er turno 2do turno 3er turno Todo 1 48 47 48 143 56.08 46.97 39.96 -1.7169 0.0076 1.8602 2 76 47 32 155 60.78 50.91 43.31 3.1788 -0.8485 -2.5707 3 36 40 34 110 43.14 36.13 30.74 -1.6309 0.9199 0.8117 Todo 160 134 114 408 Contenido de la celda Conteo Conteo esperado Residuo ajustado
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política