¿Cuáles son los métodos de estimación de mínimos cuadrados y máxima verosimilitud?

Dos métodos que se utilizan comúnmente para estimar los parámetros poblacionales de una muestra aleatoria son el método de estimación de máxima verosimilitud (predeterminado) y el método de estimación de mínimos cuadrados.
Método de la estimación de máxima verosimilitud (MLE)
La función de verosimilitud indica la probabilidad de que una muestra observada dependa de los posibles valores de los parámetros. Por lo tanto, cuando se maximiza la función de verosimilitud se determina los parámetros que tienen mayor probabilidad de producir los datos observados. Desde un punto de vista estadístico, la MLE por lo general se recomienda para muestras grandes debido a que es versátil, se puede aplicar a la mayoría de los modelos y a diferentes tipos de datos y produce las estimaciones más precisas.
Método de estimación de mínimos cuadrados (LSE)
Las estimaciones de los mínimos cuadrados se calculan mediante el ajuste de una línea de regresión a los puntos de un conjunto de datos que tiene la suma mínima de las desviaciones elevada al cuadrado (error de mínimos cuadrados). En el análisis de fiabilidad, la línea y los datos se representan en una gráfica de probabilidad.

¿Por qué el MLE es el método predeterminado en Minitab?

Para los conjuntos de datos grandes y completos, tanto el método LSE como el método MLE ofrecen resultados consistentes. En aplicaciones de fiabilidad, los conjuntos de datos suelen ser pequeños o de tamaño moderado. Muchos estudios de simulación han revelado que en diseños de muestras pequeñas donde se producen pocas fallas, el método MLE es mejor que el método LSE.1 Por lo tanto, el método de estimación predeterminado en Minitab es el MLE.

Las ventajas del método MLE sobre el método LSE son las siguientes:
  • Las estimaciones de los parámetros de distribución son más precisas.
  • La varianza estimada es más pequeña.
  • Se pueden calcular intervalos de 
confianza y pruebas para parámetros del modelo.
  • Los cálculos utilizan mayor cantidad de la información que contienen los datos.

    Cuando solo hay pocas fallas porque los datos están fuertemente censurados, el método MLE utiliza la información de todo el conjunto de datos, incluyendo los valores censurados. El método LSE ignora la información de las observaciones censuradas.1

Por lo general, las ventajas del método MLE superan a las ventajas del método LSE. El método LSE es más fácil de calcular a mano y más fácil de programar. El método LSE también está tradicionalmente asociado con el uso de las gráficas de probabilidad para evaluar la bondad de ajuste. Sin embargo, el método LSE puede proporcionar resultados engañosos en una gráfica de probabilidad. Existen ejemplos donde los puntos de una gráfica de probabilidad de Weibull que utiliza el método LSE se sitúan lo largo de una línea cuando en realidad el modelo de Weibull es inapropiado.1

1. Genschel, U. y Meeker, W.Q. (2010). A Comparison of Maximum Likelihood and Median-Rank Regression for Weibull Estimation. Quality Engineering, 22(4): 236–255.

¿Por qué los intervalos de confianza y las pruebas para parámetros del modelo no están disponibles con el método LSE?

En versiones anteriores, Minitab proporcionó resultados calculados para errores estándar, intervalos de confianza y pruebas para parámetros del modelo al utilizar el método LSE. Estos resultados calculados se basaban en un método ad hoc. Sin embargo, no hay un método estadístico establecido y aceptado para calcular los errores estándar para parámetros del modelo al utilizar el método LSE. Por lo tanto, si usted cambia el método de estimación predeterminado y selecciona Mínimos cuadrados (tiempo de falla(X) en el rango(Y)), su salida no incluirá resultados calculados para errores estándar, intervalos de confianza y pruebas para los parámetros del modelo. Si desea incluir intervalos de confianza y pruebas para parámetros del modelo en sus resultados, debe utilizar el método MLE (opción predeterminada).

Cambiar el método de estimación

Para cambiar el método de estimación de parámetros del MLE al LSE al utilizar un análisis de distribución paramétrico, una gráfica de ID de distribución o una gráfica de revisión general de distribuciones, haga lo siguiente:

  1. Elija Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura por la derecha) o Análisis de distribución (censura arbitraria).
  2. Elija uno de los siguientes análisis y haga clic en el botón apropiado:
    Análisis Botón
    Análisis de distribución paramétrico Estimar
    Gráfica de ID de distribución Opciones
    Gráfica de revisión general de distribuciones Opciones
  3. Elija Mínimos cuadrados (tiempo de falla(X) en el rango(Y)).

    Si utiliza el método de estimación de mínimos cuadrados, las estimaciones se calculan ajustando una línea de regresión a los puntos de una gráfica de probabilidad. La línea se forma haciendo una regresión del tiempo para fallar o del logaritmo de (X) (tiempo para fallar) sobre el porcentaje transformado (Y).

Puesto que los percentiles de la distribución se basan en los parámetros de distribución estimados, las diferencias en los parámetros estimados causará diferencias en los percentiles estimados.

Ingresar valores iniciales o cambiar el número máximo de iteraciones para la estimación de máxima verosimilitud

Cuando usted estima los parámetros utilizando el método de estimación de máxima verosimilitud, puede especificar valores iniciales para el algoritmo y especificar el número máximo de iteraciones.

  1. En la hoja de trabajo, ingrese los parámetros estimados para la distribución en una sola columna de la hoja de trabajo.
    La solución de máxima verosimilitud pudiera no converger si las estimaciones iniciales no se encuentran próximas a la solución real; por lo tanto, se recomienda ingresar valores iniciales aproximados para la estimación de los parámetros. Para las diferentes distribuciones, ingrese los parámetros estimados en la hoja de trabajo en el orden indicado en esta tabla.
    Distribución Parámetros
    Weibull Ingresar forma y escala
    Exponencial Ingrese la media
    Otras distribuciones de 2 parámetros Ingrese ubicación y escala
    exponencial de 2 parámetros Ingrese escala y valor umbral
    Weibull de 3 parámetros Ingrese forma, escala y valor umbral
    Otras distribuciones de 3 parámetros Ingrese ubicación, escala y valor umbral
  2. Elija Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura por la derecha) > Análisis de distribución paramétrico o Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura arbitraria) > Análisis de distribución paramétrico.
  3. Haga clic en Opciones.
  4. En Usar estimaciones de inicio, ingrese la columna de valores iniciales para el algoritmo.
  5. En Número máximo de iteraciones, ingrese el número máximo de iteraciones para alcanzar convergencia (el valor predeterminado es 20).

    Minitab obtiene las estimaciones de máxima verosimilitud a través de un proceso iterativo. Si el número máximo de iteraciones se alcanza antes de la convergencia, el algoritmo se detiene.

Especificar los parámetros para un análisis de distribución paramétrico en lugar de permitir que Minitab calcule los parámetros

Usted puede utilizar cualquiera de los métodos de estimación en Análisis de distribución paramétrico (Censura por la derecha) y Análisis de distribución paramétrico (Censura arbitraria). Sin embargo, en lugar de permitir que Minitab estime los parámetros usando uno de estos métodos, también puede especificar algunos parámetros o todos los parámetros. Si elige especificar los parámetros, los resultados calculados —tales como los percentiles— se basan en los valores de los parámetros que ingresó para el análisis.

Especificar algunos parámetros y estimar otros

Puede especificar algunos de los parámetros de su distribución y permitir que Minitab estime los demás parámetros a partir de los datos. Por lo general, usted estima algunos parámetros para realizar un análisis bayesiano cuando los datos tienen pocas o ninguna falla. Vea Cómo realizar un análisis de fiabilidad con pocas o ninguna falla para obtener más detalles.

  1. Elija Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura por la derecha) > Análisis de distribución paramétrico o Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura arbitraria) > Análisis de distribución paramétrico.
  2. Haga clic en Estimar.
  3. En Análisis de Bayes, ingrese los parámetros que desea especificar para su distribución. Los parámetros que puede especificar dependen de la distribución seleccionada:
    Distribución Parámetros que puede especificar
    Weibull Forma
    Weibull de 3 parámetros Forma, valor umbral o ambos
    Exponencial None
    Exponencial de 2 parámetros Umbral
    Otras distribuciones sin valor umbral Escala
    Otras distribuciones con valor umbral Escala, valor umbral o ambos

    Siempre se estima el parámetro de escala para la distribución de Weibull. Para las distribuciones que tienen un parámetro de ubicación, siempre se estima el parámetro de ubicación.

Especificar todos los parámetros

Usted puede especificar todos los parámetros en lugar de estimarlos a partir de los datos. Puede especificar parámetros históricos para hacer cosas como comparar las estimaciones que basó en parámetros históricos con las estimaciones basadas en los datos reales o ver cómo los datos reales se ajustan a una gráfica de probabilidad basada en los parámetros históricos.

  1. En la hoja de trabajo, ingrese los parámetros estimados para la distribución en una sola columna. Puede ingresar más de una columna de parámetros estimados si tiene más de una variable que analizar. Para las diferentes distribuciones, ingrese los parámetros estimados en la columna en el orden que indica la tabla.
    Distribución Parámetros
    Weibull Ingresar forma y escala
    Exponencial Ingrese la media
    Otras distribuciones de 2 parámetros Ingrese ubicación y escala
    exponencial de 2 parámetros Ingrese escala y valor umbral
    Weibull de 3 parámetros Ingrese forma, escala y valor umbral
    Otras distribuciones de 3 parámetros Ingrese ubicación, escala y valor umbral
  2. Elija Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura por la derecha) > Análisis de distribución paramétrico o Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura arbitraria) > Análisis de distribución paramétrico.
  3. Haga clic en Opciones.
  4. Seleccione Usar estimaciones históricas
  5. En Usar estimaciones históricas, ingrese la columna de los parámetros estimados. Si tiene más de una variable que analizar, ingrese las columnas de estimaciones en el mismo orden que ingresó las variables.

Presuponer parámetros de forma o escala común para análisis de distribución paramétrico

Cuando usted realiza un análisis de distribución paramétrico, puede hacer que Minitab presuponga parámetros de forma o escala común para las estimaciones.

  1. Elija Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura por la derecha) > Análisis de distribución paramétrico o Estadísticas > Confiabilidad/supervivencia > Análisis de distribución (censura arbitraria) > Análisis de distribución paramétrico.
  2. Haga clic en Estimar.
  3. En Método de estimación, marque Asumir forma común (pendiente-Weibull) o escala (1/pendiente-otras distribuciones).

    Luego Minitab presupone parámetros de forma o escala común al calcular las estimaciones. Por ejemplo, supongamos que usted tiene 2 (o, por lo general, k>2) muestras independientes normalmente distribuidas con medias diferentes, aunque con la misma varianza. Para estimar la media de cada muestra, Minitab utiliza una estimación agrupada de la varianza. Este enfoque también se generaliza a otras distribuciones. Sin embargo, el resultado específico depende del método de estimación que haya seleccionado para el análisis.

Método MLE con parámetros de forma o escala común

Para el método de máxima verosimilitud, Minitab utiliza la función de log-verosimilitud. En este caso, la función de log-verosimilitud del modelo es la suma de las funciones de log-verosimilitud individuales, donde se presupone el mismo parámetro de forma en cada función de log-verosimilitud individual. La función de log-verosimilitud general resultante se maximiza para obtener los parámetros de escala asociados con cada grupo y el parámetro de forma común. Para obtener más información, véase la siguiente referencia: W. Nelson (1982). Applied Life Data Analysis, Chapter 12. John Wiley & Sons.

Método LSE con parámetros de forma o escala común

Minitab primero calcula la coordenada Y y la coordenada X de cada grupo (para obtener más detalles, véase los temas "Puntos de la gráfica" y "Línea ajustada" en Métodos y fórmulas para gráfica de probabilidad en Análisis de distribución paramétrico (Censura por la derecha). Luego, para obtener las estimaciones de LSE, Minitab realiza los siguientes pasos:

  1. Agrupa los datos de coordenadas X.
  2. Agrupa los datos de coordenadas Y.
  3. Utiliza una variable indicadora (o Por variable) para identificar los grupos.
  4. Hace la regresión de las coordenadas X (respuesta) con respecto a los predictores definidos por todas las coordenadas Y (predictor continuo) y la variable indicadora (predictor categórico).
    Nota

    Para distribuciones logarítmicas de ubicación y escala (por ejemplo, Weibull), las coordenadas X deben haber experimentado transformación logarítmica. Los grupos deben tener la misma pendiente, que es la inversa del parámetro de forma común. El parámetro de escala de cada grupo se obtiene mediante la exponenciación de la intersección de cada grupo.