Ajustes y diagnósticos para Analizar variabilidad

Encuentre definiciones y ayuda para interpretar cada estadístico incluido en la tabla ajustes y diagnósticos.

Ajuste

Los valores ajustados también se denominan ajustes o . Los valores ajustados son estimaciones de puntos de la respuesta de la desviación estándar para los valores dados de los predictores. Los valores de los predictores también se denominan valores X.

Interpretación

Los valores ajustados se calculan ingresando los valores x específicos para cada observación el en conjunto de datos en la ecuación del modelo.

Por ejemplo, si la ecuación es ln (y) = ln (5 + 10x), el valor ajustado para el valor de X, 2, es 3.21888 (ln(5 + 10(2))).

Las observaciones con valores ajustados que sean muy diferentes del valor observado pueden ser poco comunes. Las observaciones con valores predictores poco comunes podrían ser influyentes. Si Minitab determina que los datos incluyen valores poco comunes o influyentes, la salida incluye la tabla Ajustes y diagnósticos para observaciones poco comunes, que identifica estas observaciones. Las observaciones con residuos estandarizados grandes no siguen adecuadamente la ecuación de regresión propuesta. Sin embargo, se espera que se tengan algunas observaciones poco comunes. Por ejemplo, con base en los criterios para los residuos estandarizados grandes, se esperaría que aproximadamente el 5% de las observaciones se etiquete como con un residuo estandarizado grande. Para obtener más información sobre valores poco comunes, vaya a Observaciones poco comunes.

Intervalo de confianza para respuesta original (IC de 95 %)

Estos intervalos de confianza (IC) son rangos de valores que probablemente contienen la respuesta de la desviación estándar para la población que tiene los valores observados de los predictores o factores en el modelo.

Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si se repite la muestra muchas veces, un determinado porcentaje de los intervalos de confianza resultantes incluirá el parámetro de población desconocido. El porcentaje de estos intervalos de confianza que contiene el parámetro es el nivel de confianza del intervalo.

El intervalo de confianza consta de las dos partes siguientes:
Estimación de punto
La estimación de punto se calcula a partir de los datos de la muestra.
Margen de error
El margen de error define la amplitud del intervalo de confianza y es determinado por la variabilidad observada en la muestra, el tamaño de la muestra y el nivel de confianza.

Interpretación

Utilice el intervalo de confianza para evaluar la estimación del valor ajustado para los valores observados de las variables.

Por ejemplo, con un nivel de confianza de 95%, se puede estar 95% seguro de que el intervalo de confianza contiene la desviación estándar de población para los valores especificados de las variables predictoras o los factores en el modelo. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Un intervalo de confianza amplio indica que se puede estar menos seguro de la desviación estándar de los valores futuros. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.

Residuo de relación

El residuo de relación es la desviación estándar observada dividida entre el valor ajustado.

Ln(Est.)

El logaritmo natural de la desviación estándar de la respuesta observada.

Ln (Ajuste)

El logaritmo natural de la desviación estándar ajustada.

EE Ln(Ajuste)

El error estándar del logaritmo natural de la desviación estándar ajustada estima la variación en la desviación estándar estimada para la configuración especificada de las variables. El cálculo del intervalo de confianza para la respuesta media utiliza el error estándar del ajuste. Los errores estándar son siempre no negativos.

Interpretación

Utilice el error estándar del ajuste para medir la precisión de la estimación del logaritmo natural de la desviación estándar. Cuanto menor sea el error estándar, más precisa será la estimación.

Intervalo de confianza para respuesta transformada (IC de 95%)

Estos intervalos de confianza (IC) son rangos de valores que probablemente contienen el logaritmo natural de la desviación estándar para la población que tiene los valores observados de los predictores o factores en el modelo.

Puesto que las muestras son aleatorias, es poco probable que dos muestras de una población produzcan intervalos de confianza idénticos. Sin embargo, si se repite la muestra muchas veces, un determinado porcentaje de los intervalos de confianza resultantes incluirá el parámetro de población desconocido. El porcentaje de estos intervalos de confianza que contiene el parámetro es el nivel de confianza del intervalo.

El intervalo de confianza consta de las dos partes siguientes:
Estimación de punto
La estimación de punto se calcula a partir de los datos de la muestra.
Margen de error
El margen de error define la amplitud del intervalo de confianza y es determinado por la variabilidad observada en la muestra, el tamaño de la muestra y el nivel de confianza.

Interpretación

Utilice el intervalo de confianza para evaluar la estimación del valor ajustado para los valores observados de las variables.

Por ejemplo, con un nivel de confianza de 95%, se puede estar 95% seguro de que el intervalo de confianza contiene la desviación estándar logarítmica de población para los valores especificados de las variables predictoras o los factores en el modelo. El intervalo de confianza ayuda a evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado para determinar si el intervalo de confianza incluye valores que tienen significancia práctica para su situación. Un intervalo de confianza amplio indica que se puede estar menos seguro de la desviación estándar de los valores futuros. Si el intervalo es demasiado amplio para ser útil, considere aumentar el tamaño de la muestra.

Ln(Residuo)

La diferencia entre el logaritmo natural de la desviación estándar de la respuesta observada y el logaritmo natural de la desviación estándar ajustada. Es el logaritmo del residuo de relación.

Interpretación

El residuo logarítmico representa la parte de la respuesta observada que el modelo no explica. Entre los tipos de residuos que Minitab calcula en Analizar variabilidad, los residuos logarítmicos se asemejan mucho a los residuos regulares.

Ln Est.(Residuo)

Los residuos estandarizados para el logaritmo natural son iguales a los residuos logarítmicos divididos entre su error estándar (asintótico)

Interpretación

Utilice los residuos estandarizados del logaritmo natural como ayuda para detectar valores atípicos. Cuando los valores Ln Est.(Residuo) se encuentran entre −2 y 2, no hay observaciones poco comunes en los datos.

Los residuos estandarizados mayores que 2 y menores que −2 por lo general se consideran grandes. Las observaciones que Minitab etiqueta no siguen adecuadamente la ecuación de regresión propuesta. Sin embargo, se espera que se tengan algunas observaciones poco comunes. Por ejemplo, con base en los criterios para los residuos estandarizados grandes, se esperaría que aproximadamente el 5% de las observaciones se etiquete como con un residuo estandarizado grande. Para obtener más información, vaya a Observaciones poco comunes.

Los residuos estandarizados son útiles porque los residuos sin procesar podrían no ser buenos indicadores de valores atípicos. La varianza de cada residuo sin procesar puede diferir por los valores x asociados con la misma. Esta variación desigual hace que sea dificil evaluar las magnitudes de los residuos sin procesar. La estandarización de los residuos soluciona este problema al convertir las diferentes varianzas a una escala común.

Hi (apalancamiento)

El Hi, también denominado apalancamiento, mide la distancia del valor x de una observación hasta el promedio de los valores x de todas las observaciones en un conjunto de datos.

Interpretación

Los valores de Hi están entre 0 y 1. Minitab identifica las observaciones con valores de apalancamiento superior a 3p/n o 0.99, el valor que sea menor, mediante una X en la tabla de ajustes y diagnósticos de observaciones poco usuales. En 3p/n, p es el número de coeficientes en el modelo y n es el número de observaciones. Las observaciones que Minitab etiqueta con una 'X' podrían ser influyentes.

Las observaciones influyentes tienen un efecto desproporcionado sobre el modelo y pueden generar resultados engañosos. Por ejemplo, la inclusión o exclusión de un punto influyente puede cambiar el hecho de que un coeficiente sea estadísticamente significativo o no. Las observaciones influyentes pueden ser puntos de apalancamiento, valores atípicos o ambos.

Si ve una observación influyente, determine si la observación es un error de entrada de datos o de medición. Si la observación no es un error de entrada de datos ni de medición, determine qué tan influyente es la observación. En primer lugar, ajuste el modelo con y sin la observación. Luego, compare los coeficientes, los valores p, el R2 y otras informaciones del modelo. Si el modelo cambia significativamente al eliminar la observación influyente, examine más a fondo el modelo para determinar si se especificó de forma incorrecta. Es posible que tenga que recopilar más datos para resolver el problema.

Distancia (D) de Cook

La distancia de Cook (D) mide el efecto que tiene una observación sobre el conjunto de coeficientes en un modelo lineal. La distancia de Cook considera tanto el valor de apalancamiento como el residuo estandarizado de cada observación para determinar el efecto de la observación.

Interpretación

Las observaciones con una D grande pueden ser consideradas influyentes. Un criterio comúnmente utilizado para un valor D grande es cuando D es mayor que la mediana de la distribución F: F(0.5, p. n-p), donde p es el número de términos del modelo, incluyendo la constante y n es el número de observaciones. Otra manera de examinar los valores D consiste en compararlos entre sí, utilizando una gráfica, como una gráfica de valores individuales. Las observaciones con valores D que sean grandes en comparación con los demás valores podrían ser influyentes.

Las observaciones influyentes tienen un efecto desproporcionado sobre el modelo y pueden generar resultados engañosos. Por ejemplo, la inclusión o exclusión de un punto influyente puede cambiar el hecho de que un coeficiente sea estadísticamente significativo o no. Las observaciones influyentes pueden ser puntos de apalancamiento, valores atípicos o ambos.

Si ve una observación influyente, determine si la observación es un error de entrada de datos o de medición. Si la observación no es un error de entrada de datos ni de medición, determine qué tan influyente es la observación. En primer lugar, ajuste el modelo con y sin la observación. Luego, compare los coeficientes, los valores p, el R2 y otras informaciones del modelo. Si el modelo cambia significativamente al eliminar la observación influyente, examine más a fondo el modelo para determinar si se especificó de forma incorrecta. Es posible que tenga que recopilar más datos para resolver el problema.

DFITS

DFITS mide el efecto que tiene cada observación sobre los valores ajustados en un modelo lineal. DFITS representa aproximadamente el número de desviaciones estándar que el valor ajustado cambia cuando cada observación se elimina del conjunto de datos y se vuelve a ajustar el modelo.

Interpretación

Las observaciones que tienen un valor de DFITS grande pudieran ser influyentes. Un criterio comúnmente utilizado para un valor de DFITS grande es si el DFITS es mayor que lo siguiente:
TérminoDescription
pel número de términos del modelo
nel número de observaciones

Si ve una observación influyente, determine si la observación es un error de entrada de datos o de medición. Si la observación no es un error de entrada de datos ni de medición, determine qué tan influyente es la observación. En primer lugar, ajuste el modelo con y sin la observación. Luego, compare los coeficientes, los valores p, el R2 y otras informaciones del modelo. Si el modelo cambia significativamente al eliminar la observación influyente, examine más a fondo el modelo para determinar si se especificó de forma incorrecta. Es posible que tenga que recopilar más datos para resolver el problema.