El histograma de residuos muestra la distribución de los residuos para todas las observaciones.
Patrón | Lo que el patrón puede indicar |
---|---|
Una larga cola en una dirección | Asimetría |
Una barra que se encuentra muy alejada de las otras barras | Un valor atípico |
Puesto que la apariencia de un histograma depende del número de intervalos usados para agrupar los datos, no utilice un histograma para evaluar la normalidad de los residuos. En su lugar, utilice una gráfica de probabilidad normal.
Un histograma es más efectivo cuando tiene aproximadamente 20 o más puntos de datos. Si la muestra es demasiado pequeña, entonces cada barra en el histograma no contiene suficientes puntos de datos para de manera fiable mostrar asimetría o valores atípicos.
La gráfica de probabilidad normal de residuos muestra los residuos versus los valores esperados cuando la distribución es normal.
Utilice la gráfica de probabilidad normal de los residuos para comprobar las premisas de que los residuos están distribuidos normalmente. La gráfica de probabilidad normal de los residuos debe seguir aproximadamente una línea recta.
La curva S implica una distribución con colas largas.
La curva S invertida implica una distribución con colas cortas.
La curva descendente implica una distribución con asimetría a la derecha.
Algunos puntos alejados de la línea implican una distribución con valores atípicos.
Si observa un patrón no normal, utilice las otras gráficas de residuos para verificar otros problemas con el modelo, como términos faltantes o un efecto del orden cronológico. Si los residuos no siguen una distribución normal, los intervalos de confianza y los valores p pueden ser inexactos.
La gráfica de residuos vs. ajustes muestra los residuos en el eje Y y los valores ajustados en el eje X.
Utilice la gráfica de residuos vs. ajustes para comprobar el supuesto de que los residuos están distribuidos aleatoriamente y tienen una varianza constante. Lo ideal sería que los puntos estuvieran ubicados de manera aleatoria a ambos lados de 0, sin patrones reconocibles en los puntos.
Patrón | Lo que el patrón puede indicar |
---|---|
Dispersión en abanico o irregular de los residuos en los valores ajustados | Varianza no constante |
Curvilíneo | Un término de orden superior faltante |
Un punto que está alejado de cero | Un valor atípico |
Un punto que está lejos de los otros puntos en la dirección x | Un punto influyente |
Uno de los puntos es mucho más largo que todos los otros puntos. Por lo tanto, el punto es un valor atípico. Si hay demasiados valores atípicos, el modelo podría no ser aceptable. Se debe tratar de identificar la causa de cualquier valor atípico. Corrija cualquier error de entrada de datos o de medición. Considere eliminar los valores de datos que estén asociados con eventos anormales y únicos (causas especiales). Luego, repita el análisis.
La varianza de los residuos aumenta con los valores ajustados. Tenga en cuenta que, a medida que el valor de los ajustes aumenta, la dispersión entre los residuos se amplía. Este patrón indica que las varianzas de los residuos son desiguales (no constante).
Problema | Posible solución |
---|---|
Varianza no constante | Considere utilizar una transformación de Box-Cox de la variable de respuesta o las ponderaciones.. |
Un valor atípico o punto de influencia |
|
La gráfica de residuos versus orden muestra los residuos en el orden en que se recopilan los datos.
La gráfica residuos vs. las variables muestra los residuos versus otra variable. La variable pudiera estar ya incluida en el modelo. O, la variable podría no estar en el modelo, pero se sospecha que influye en la respuesta.
Si observa un patrón no aleatorio en los residuos, indica que la variable influye en la respuesta de forma sistemática. Considere incluir esta variable en un análisis.