Gráficas de residuos para Analizar diseño factorial

Encuentre definiciones y ayuda para interpretar cada una de las gráficas de residuos.

Histograma de residuos

El histograma de residuos muestra la distribución de los residuos para todas las observaciones.

Interpretación

Utilice el histograma de los residuos para determinar si los datos son asimétricos o incluyen valores atípicos. Los patrones en la siguiente tabla pueden indicar que el modelo no cumplen con las premisas del modelo.
Patrón Lo que el patrón puede indicar
Una larga cola en una dirección Asimetría
Una barra que se encuentra muy alejada de las otras barras Un valor atípico

Puesto que la apariencia de un histograma depende del número de intervalos usados para agrupar los datos, no utilice un histograma para evaluar la normalidad de los residuos. En su lugar, utilice una gráfica de probabilidad normal.

Un histograma es más efectivo cuando tiene aproximadamente 20 o más puntos de datos. Si la muestra es demasiado pequeña, entonces cada barra en el histograma no contiene suficientes puntos de datos para de manera fiable mostrar asimetría o valores atípicos.

Gráfica de probabilidad normal de los residuos

La gráfica de probabilidad normal de residuos muestra los residuos versus los valores esperados cuando la distribución es normal.

Interpretación

Utilice la gráfica de probabilidad normal de los residuos para comprobar las premisas de que los residuos están distribuidos normalmente. La gráfica de probabilidad normal de los residuos debe seguir aproximadamente una línea recta.

Los patrones siguientes no cumplen con la premisa de que los residuos están distribuidos normalmente.

La curva S implica una distribución con colas largas.

La curva S invertida implica una distribución con colas cortas.

La curva descendente implica una distribución con asimetría a la derecha.

Algunos puntos alejados de la línea implican una distribución con valores atípicos.

Si observa un patrón no normal, utilice las otras gráficas de residuos para verificar otros problemas con el modelo, como términos faltantes o un efecto del orden cronológico. Si los residuos no siguen una distribución normal, los intervalos de confianza y los valores p pueden ser inexactos.

Residuos vs. ajustes

La gráfica de residuos vs. ajustes muestra los residuos en el eje Y y los valores ajustados en el eje X.

Interpretación

Utilice la gráfica de residuos vs. ajustes para comprobar el supuesto de que los residuos están distribuidos aleatoriamente y tienen una varianza constante. Lo ideal sería que los puntos estuvieran ubicados de manera aleatoria a ambos lados de 0, sin patrones reconocibles en los puntos.

Los patrones de la tabla siguiente pueden indicar que el modelo no cumple los supuestos del modelo.
Patrón Lo que el patrón puede indicar
Dispersión en abanico o irregular de los residuos en los valores ajustados Varianza no constante
Curvilíneo Un término de orden superior faltante
Un punto que está alejado de cero Un valor atípico
Un punto que está lejos de los otros puntos en la dirección x Un punto influyente
Los siguientes gráficos muestran un valor atípico y un incumplimiento de la premisa de que la varianza de los residuos es constante.
Gráfica con valor atípico

Uno de los puntos es mucho más largo que todos los otros puntos. Por lo tanto, el punto es un valor atípico. Si hay demasiados valores atípicos, el modelo podría no ser aceptable. Se debe tratar de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). Luego, repita el análisis.

Gráfica con varianza no constante

La varianza de los residuos aumenta con los valores ajustados. Tenga en cuenta que, a medida que el valor de los ajustes aumenta, la dispersión entre los residuos se amplía. Este patrón indica que las varianzas de los residuos son desiguales (no constante).

Si usted identifica algún patrón o valores atípicos en la gráfica Residuos vs. ajustes, considere las soluciones siguientes:
Problema Posible solución
Varianza no constante Considere utilizar una transformación de Box-Cox de la variable de respuesta o las ponderaciones..
Un valor atípico o punto de influencia
  1. Verifique que la observación no sea un error de medición o un error de ingreso de datos.
  2. Considere realizar el análisis sin esta observación para determinar cómo afecta los resultados.

Residuos vs. orden

La gráfica de residuos versus orden muestra los residuos en el orden en que se recopilan los datos.

Interpretación

Utilice la gráfica de orden versus residuos para comprobar la premisa de que los residuos son independientes unos de otros. Los residuos independientes no muestran tendencias o patrones cuando se muestran en orden de tiempo. Los patrones en los puntos podrían indicar que los residuos que están cerca entre sí podrían estar correlacionados y por lo tanto, no son independientes. Idealmente, los residuos en la gráfica deben caer aleatoriamente alrededor de la línea central:
Si observa un patrón, investigue la causa. Los siguientes tipos de patrones pueden indicar que los residuos son dependientes.
Tendencia
Turno
Ciclo

Residuos versus las variables

La gráfica residuos vs. las variables muestra los residuos versus otra variable. La variable pudiera estar ya incluida en el modelo. O, la variable podría no estar en el modelo, pero se sospecha que influye en la respuesta.

Interpretación

Si observa un patrón no aleatorio en los residuos, indica que la variable influye en la respuesta de forma sistemática. Considere incluir esta variable en un análisis.