Validar los supuestos del modelo en regresión o ANOVA

La regresión y el ANOVA no se detienen cuando el modelo se ajusta. Usted debería examinar las gráficas de residuos y otros estadísticos de diagnóstico para determinar si el modelo es adecuado y si se cumplen los supuestos de la regresión. Si el modelo no es adecuado, representará incorrectamente los datos. Por ejemplo:
  • Los errores estándar de los coeficientes podrían estar sesgados, conduciendo a valores t y p incorrectos.
  • Los coeficientes pueden tener el signo incorrecto.
  • El modelo puede verse afectado por uno o dos puntos.
Utilice la siguiente tabla para determinar si el modelo es adecuado.
Características de un modelo de regresión adecuado Verificar usando Soluciones posibles
La forma funcional modela adecuadamente cualquier curvatura que esté presente.

Prueba de falta de ajuste

Gráfica de residuos vs. variables

Agregar término de orden superior al modelo

Transformar las variables

Regresión no lineal

Los residuos tienen una varianza constante.

Gráfica de residuos vs. ajustes

Transformar las variables

Mínimos cuadrados ponderados

Los residuos son independientes (no están correlacionados) entre sí.

Estadístico de Durbin-Watson

Gráfica de residuos versus orden

Agregar nuevo predictor

Usar análisis de series de tiempo

Agregar una variable de desfase

Los residuos están distribuidos normalmente.

Histograma de residuos

Gráfica normal de residuos

Gráfica de residuos vs. ajuste

Prueba de normalidad

Transformar las variables

Verificar si hay valores atípicos

Sin observaciones poco comunes ni valores atípicos.

Gráficas de residuos

Apalancamientos

Distancia de Cook

DFITS

Transformar las variables

Eliminar la observación atípica

Los datos no están mal condicionados.

Factor de inflación de la varianza (FIV)

Matriz de correlación de los predictores

Eliminar el predictor

Regresión de mínimos cuadrados parciales

Transformar las variables

Determinar por qué un modelo no cumple los supuestos

Si determina que el modelo no cumple con los criterios mencionados anteriormente, usted debe:
  1. Determinar si los datos fueron ingresados de forma correcta, especialmente las observaciones identificadas como poco comunes.
  2. Intentar determinar la causa del problema. Conviene indagar qué tan sensible es el modelo al problema planteado. Por ejemplo, si tiene un valor atípico, ejecute la regresión sin esa observación y observe cómo cambian los resultados.
  3. Considere la posibilidad de usar una de las soluciones posibles indicadas anteriormente.