El conteo observado es el número real de observaciones en una muestra que pertenecen a una categoría.
El conteo esperado es la frecuencia que se esperaría en una celda, en promedio, si las variables fueran independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.
Usted puede comparar los valores observados y los valores esperados de cada celda de la tabla de salida. En estos resultados, el conteo observado de celda es el primer número en cada celda y el conteo esperado es el segundo número en cada celda.
Si dos variables están asociadas, entonces la distribución de las observaciones de una variable diferirá dependiendo de la categoría de la segunda variable. Si dos variables son independientes, entonces la distribución de las observaciones de una variable será similar para todas las categorías de la segunda variable. En este ejemplo, en la columna 1, fila 2 de la tabla, el conteo observado es 76 y el conteo esperado es 60.78. El conteo observado parece ser mucho más grande de lo que se podría esperar si las variables fueran independientes.
1er turno | 2do turno | 3er turno | Todo | |
---|---|---|---|---|
1 | 48 | 47 | 48 | 143 |
56.08 | 46.97 | 39.96 | ||
-1.0788 | 0.0050 | 1.2726 | ||
2 | 76 | 47 | 32 | 155 |
60.78 | 50.91 | 43.31 | ||
1.9516 | -0.5476 | -1.7184 | ||
3 | 36 | 40 | 34 | 110 |
43.14 | 36.13 | 30.74 | ||
-1.0867 | 0.6443 | 0.5889 | ||
Todo | 160 | 134 | 114 | 408 |
Utilice los conteos marginales para entender cómo están distribuidos los conteos entre las categorías.
En estos resultados, el total de la fila 1 es 143, el total de la fila 2 es 155, y el total de la fila 3 es 110. La suma de todas las filas es 408. El total de la columna 1 es 160, el total de la columna 2 es 134 y el total de la columna 3 es 114. La suma de todas las columnas es 408.
1er turno | 2do turno | 3er turno | Todo | |
---|---|---|---|---|
1 | 48 | 47 | 48 | 143 |
56.08 | 46.97 | 39.96 | ||
-1.0788 | 0.0050 | 1.2726 | ||
2 | 76 | 47 | 32 | 155 |
60.78 | 50.91 | 43.31 | ||
1.9516 | -0.5476 | -1.7184 | ||
3 | 36 | 40 | 34 | 110 |
43.14 | 36.13 | 30.74 | ||
-1.0867 | 0.6443 | 0.5889 | ||
Todo | 160 | 134 | 114 | 408 |
Minitab muestra la contribución de cada celda al estadístico de chi-cuadrada, que cuantifica qué tanto del estadístico total de chi-cuadrada es atribuible a la divergencia de cada celda.
Minitab calcula la contribución de cada celda al estadístico de chi-cuadrada como el cuadrado de la diferencia entre los valores observados y esperados para una celda, dividido entre el valor esperado para esa celda. El estadístico de chi-cuadrada es la suma de estos valores para todas las celdas.
1er turno | 2do turno | 3er turno | Todo | |
---|---|---|---|---|
1 | 48 | 47 | 48 | 143 |
56.08 | 46.97 | 39.96 | ||
1.1637 | 0.0000 | 1.6195 | ||
2 | 76 | 47 | 32 | 155 |
60.78 | 50.91 | 43.31 | ||
3.8088 | 0.2998 | 2.9530 | ||
3 | 36 | 40 | 34 | 110 |
43.14 | 36.13 | 30.74 | ||
1.1809 | 0.4151 | 0.3468 | ||
Todo | 160 | 134 | 114 | 408 |
Chi-cuadrada | GL | Valor p | |
---|---|---|---|
Pearson | 11.788 | 4 | 0.019 |
Relación de verosimilitud | 11.816 | 4 | 0.019 |
El estadístico de chi-cuadrada de Pearson (X2) se basa en la diferencia al cuadrado entre las frecuencias observadas y las esperadas.
El estadístico de chi-cuadrada de relación de verosimilitud (G2) se basa en la relación de frecuencias observadas a frecuencias esperadas.
Utilice los estadísticos de chi-cuadrada para comprobar si las variables están asociadas.
En estos resultados, ambos estadísticos de chi-cuadrada son muy similares. Utilice los valores p para evaluar la significancia de los estadísticos de chi-cuadrada.Chi-cuadrada | GL | Valor p | |
---|---|---|---|
Pearson | 11.788 | 4 | 0.019 |
Relación de verosimilitud | 11.816 | 4 | 0.019 |
Cuando los conteos esperados son pequeños, los resultados pueden ser engañosos. Para obtener más información, consulte Consideraciones acerca de los datos para Prueba chi-cuadrada para asociación
Los grados de libertad (GL) son el número de informaciones independientes sobre un estadístico. Los grados de libertad de una tabla son iguales a (número de filas – 1), multiplicado por (número de columnas – 1).
Minitab utiliza los grados de libertad para determinar el valor p asociado al estadístico de prueba.
En estos resultados, los grados de libertad (GL) son 4.
Chi-cuadrada | GL | Valor p | |
---|---|---|---|
Pearson | 11.788 | 4 | 0.019 |
Relación de verosimilitud | 11.816 | 4 | 0.019 |
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las probabilidades más bajas proporcionan una evidencia más fuerte en contra de la hipótesis nula.
Utilice el valor p para determinar si puede o no puede rechazar la hipótesis nula, que dice que no existe ninguna asociación entre dos variables categóricas.
Minitab utiliza el estadístico de chi-cuadrada para determinar el valor p.
Minitab no muestra el valor p cuando cualquier conteo esperado es menor que 1, porque los resultados podrían no ser válidos.
En estos resultados, valor p = 0.019. Puesto que el valor p es menor que α, usted rechaza la hipótesis nula. Usted puede concluir que las variables están asociadas.
Chi-cuadrada | GL | Valor p | |
---|---|---|---|
Pearson | 11.788 | 4 | 0.019 |
Relación de verosimilitud | 11.816 | 4 | 0.019 |
El conteo esperado es la frecuencia que se esperaría en una celda, en promedio, si las variables fueran independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.
Usted puede comparar los valores observados y los valores esperados en la tabla de salida.
1er turno | 2do turno | 3er turno | Todo | |
---|---|---|---|---|
1 | 48 | 47 | 48 | 143 |
56.08 | 46.97 | 39.96 | ||
-8.078 | 0.034 | 8.044 | ||
2 | 76 | 47 | 32 | 155 |
60.78 | 50.91 | 43.31 | ||
15.216 | -3.907 | -11.309 | ||
3 | 36 | 40 | 34 | 110 |
43.14 | 36.13 | 30.74 | ||
-7.137 | 3.873 | 3.265 | ||
Todo | 160 | 134 | 114 | 408 |
Los residuos estandarizados son los residuos sin procesar (o la diferencia entre los conteos observados y los conteos esperados), divididos entre la raíz cuadrada de los conteos esperados.
Usted puede comparar los residuos estandarizados en la tabla de salida para ver qué categoría de variables presenta la mayor diferencia entre los conteos esperados y los conteos reales en relación con el tamaño de la muestra y parecen ser dependientes. Por ejemplo, puede evaluar los residuos estandarizados de la tabla de salida para ver la asociación entre la máquina y el turno para producir defectos.
1er turno | 2do turno | 3er turno | Todo | |
---|---|---|---|---|
1 | 48 | 47 | 48 | 143 |
56.08 | 46.97 | 39.96 | ||
-1.0788 | 0.0050 | 1.2726 | ||
2 | 76 | 47 | 32 | 155 |
60.78 | 50.91 | 43.31 | ||
1.9516 | -0.5476 | -1.7184 | ||
3 | 36 | 40 | 34 | 110 |
43.14 | 36.13 | 30.74 | ||
-1.0867 | 0.6443 | 0.5889 | ||
Todo | 160 | 134 | 114 | 408 |
Los residuos ajustados son los residuos sin procesar (o la diferencia entre los conteos observados y los conteos esperados) divididos entre una estimación del error estándar. Utilice los residuos ajustados para explicar la variación debido al tamaño de la muestra.
Usted puede comparar los residuos ajustados en la tabla de salida para ver qué categorías presentan la mayor diferencia entre los conteos esperados y los conteos reales en relación con el tamaño de la muestra. Por ejemplo, puede ver qué máquina o turno presenta la mayor diferencia entre el número esperado de unidades defectuosas y el número real de unidades defectuosas.
1er turno | 2do turno | 3er turno | Todo | |
---|---|---|---|---|
1 | 48 | 47 | 48 | 143 |
56.08 | 46.97 | 39.96 | ||
-1.7169 | 0.0076 | 1.8602 | ||
2 | 76 | 47 | 32 | 155 |
60.78 | 50.91 | 43.31 | ||
3.1788 | -0.8485 | -2.5707 | ||
3 | 36 | 40 | 34 | 110 |
43.14 | 36.13 | 30.74 | ||
-1.6309 | 0.9199 | 0.8117 | ||
Todo | 160 | 134 | 114 | 408 |