¿Qué es una observación poco común?

Las observaciones poco comunes (también llamadas observaciones influyentes) son observaciones que tienen un impacto desproporcionado en un modelo de regresión o ANOVA. Es importante identificar las observaciones poco comunes porque pueden producir resultados engañosos. Por ejemplo, una observación poco común puede hacer que un coeficiente significativo parezca insignificante.

Las observaciones poco comunes pueden ser de cualquiera de estos dos tipos o de ambos tipos:
  • Puntos de apalancamiento, que sean extremos en la dirección X.
  • Valores atípicos (residuos grandes), que sean extremos en la dirección Y en relación con la línea de regresión ajustada.

Identificar observaciones poco comunes

Para identificar observaciones poco comunes, examine las medidas de diagnóstico, incluyendo los valores de apalancamiento, los residuos, la D de Cook y los DFITS. Los valores muy grandes de estos estadísticos identifican que una observación pudiera ser poco común. Minitab etiqueta las observaciones con valores extremos de apalancamiento o residuo (valores atípicos) en la tabla Ajustes y diagnósticos de Observaciones poco comunes como se muestra a continuación:
  • Una X denota un punto con un valor de apalancamiento grande. Minitab etiqueta los valores de apalancamiento mayores que 3 * número de términos en el modelo/número de observaciones o los valores de apalancamiento mayores que 0.99, lo que sea menor.
  • Una R denota un residuo estandarizado extremo. Minitab etiqueta los residuos estandarizados con valores absolutos mayores que 2.

Las observaciones que Minitab etiqueta no siguen adecuadamente la ecuación de regresión propuesta. Sin embargo, se espera que haya algunas observaciones poco comunes. Por ejemplo, con base en los criterios para los residuos grandes, se esperaría que aproximadamente el 5% de las observaciones sean marcadas como observaciones con un residuo grande.

Ejemplo de la tabla de observaciones poco comunes

Ajustes y diagnósticos para observaciones poco comunes Resid Obs FlujoCalor Ajuste Resid est. 1 271.80 274.74 -2.94 -0.40 X 22 254.50 230.91 23.59 2.74 R Residuo grande R X poco común X

En la salida anterior, la observación 1 se denotó con una X, lo que la identifica como un punto de apalancamiento. La observación 22, denotada con una R, es un valor atípico.

Determinar la manera en que las observaciones poco comunes afectan el modelo

Para determinar qué tan grande es el efecto de la observación poco común, usted puede ajustar el modelo con y sin la observación y comparar los coeficientes, los valores p, el R2 y otros parámetros del modelo. Si el modelo cambia significativamente al eliminar la observación poco común, determine en primer lugar si la observación es un error de entrada de datos o un error de medición. Si no es así, examine más a fondo el modelo para determinar si omitió un término (por ejemplo, un término de interacción) o una variable importante, o si especificó incorrectamente el modelo. Es posible que tenga que recoger más datos para determinar una solución.