O que são os métodos de mínimos quadrados e máxima verossimilhança?

Duas abordagens comumente usadas para estimar parâmetros de populações em uma amostra aleatória são o método de estimativa da máxima verossimilhança (padrão) e estimativa de mínimos quadrados.
Método de estimativa da máxima verossimilhança (MLE)
A função de verossimilhança indica quão provável a amostra observada é como uma função de possíveis valores de parâmetro. Por tanto, maximizar a função de verossimilhança determina os parâmetros que têm maior probabilidade de produzir os dados observados. De um ponto de vista estatístico, o MLE é normalmente recomendado para grandes amostras porque ele é versátil, aplicável à maioria dos modelos e diferentes tipos de dados, e produz as estimativas mais precisas.
Método de estimativa de mínimos quadrados (LSE)
As estimativas de mínimos quadrados são calculadas ajustando-se uma linha de regressão aos pontos de um conjunto de dados com a soma mínima dos desvios padrão elevados ao quadrado (erro mínimo quadrado). Em análises de confiabilidade, a linha e os dados são representados graficamente em um gráfico de probabilidade.

Porque o MLE é o método padrão no Minitab?

Para conjuntos de dados grandes e completos, os dois métodos, LSE e MLE geram resultados consistentes. Em aplicações de confiabilidade, os conjuntos de dados são tipicamente de tamanho pequeno ou moderado. Estudos de simulação extensivos mostram que em experimentos de pequenas amostras onde há apenas algumas falhas, o método MLE é melhor do que o método LSE.1 Desta forma, o método de estimativa padrão no Minitab é MLE.

As vantagens do método MLE em relação ao método LSE são as seguintes:
  • As estimativas do parâmetro de distribuição são mais precisas.
  • A variância estimada é menor.
  • Os intervalos de confiança e testes de parâmetros do modelo podem ser calculados de forma confiável.
  • Os cálculos usam mais informações dos dados.

    Quando há apenas algumas falhas devido aos dados estarem pesadamente censurados, o método MLE usa as informações no conjunto de dados inteiro, incluindo os valores censurados. O método LSE ignora as informações nas observações censuradas.1

Normalmente, as vantagens do método MLE prevalecem sobre as vantagens do método LSE. O método LSE é mais fácil de calcular manualmente e mais fácil de programar. O método LSE também é tradicionalmente associado ao uso de gráficos de probabilidade para avaliar a qualidade do ajuste. Contudo, o método LSE pode fornecer resultados enganosos em um gráfico de probabilidade. Existem exemplos onde os pontos em um gráfico de probabilidade de Weibull, que usa o método LSE, caem ao longo de uma linha quando o modelo Weibull é realmente inadequado.1

1. Genschel, U. and Meeker, W.Q. (2010). A Comparison of Maximum Likelihood and Median-Rank Regression for Weibull Estimation. Quality Engineering, 22(4): 236–255.

Por que os intervalos de confiança e os testes de parâmetros do modelo não estão disponíveis com o método LSE?

Em versões anteriores, o Minitab forneceu resultados calculados para erros padrão, intervalos de confiança e testes para os parâmetros do modelo ao usar o método LSE. Estes resultados calculados foram baseados em um método ad-hoc. No entanto, não existe um método estatístico estabelecido e aceito para calcular os erros padrão para os parâmetros do modelo com o método LSE. Portanto, se você alterar o método padrão da estimativa e selecionar Mínimos quadrados (tempo de falha(X) no posto(Y)), sua saída não incluirá resultados calculados para erros padrão, intervalos de confiança e testes para os parâmetros do modelo. Se você quiser incluir intervalos de confiança e testes de parâmetros do modelo em seus resultados, deve usar o método MLE (padrão).

Mudar o método de estimativa

Para alterar o método de estimativa de parâmetros de MLE para LSE ao usar uma análise de distribuição paramétrica, um gráfico de identificação de distribuição ou um gráfico de visão geral da distribuição, faça o seguinte:

  1. Selecione Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura à direita) ou Análise de distribuição (censura arbitrária).
  2. Selecione uma das análises a seguir e clique no botão adequado:
    Análise Botão
    Análise de distribuição paramétrica Estimativa
    Gráfico de identificação de distribuição Opções
    Gráfico da visão geral de distribuição Opções
  3. Selecione Mínimos Quadrados (tempo de falha (X) no posto (Y)).

    Se você usa o método de estimativa de mínimos quadrados, as estimativas são calculadas ajustando-se uma linha de regressão aos pontos em um gráfico de probabilidade. A linha é formada regressando-se o tempo até a falha ou log (tempo até a falha) (X) no percentual transformado (Y).

Como os percentis da distribuição são baseados nos parâmetros de distribuição estimados, as diferenças nos parâmetros estimados gerarão diferenças nos percentis estimados.

Digite valores iniciais ou altere o número máximo de iterações para estimar a máxima verossimilhança

Ao estimar os parâmetros usando o método de estimativa da máxima verossimilhança, você pode especificar valores iniciais para o algoritmo e especificar o número máximo de iterações.

  1. Na worksheet, digite estimativas de parâmetros para a distribuição em uma única coluna da worksheet.
    A solução de máxima verossimilhança pode não convergir se as estimativas iniciais não estiverem nas proximidades da solução real; por isso você deve digitar valores iniciais aproximados para estimativas de parâmetros. Para as diferentes distribuições, digite as estimativas de parâmetros na worksheet na ordem indicada por esta tabela.
    Distribuição Parâmetros
    Weibull Digite a forma e a escala
    Exponencial Digite a média
    Outras distribuições com 2 parâmetros Digite o local e a escala
    Exponencial de 2 parâmetros Digite a escala e o limite
    Weibull de 3 parâmetros Digite a forma, a escala e o limite
    Outras distribuições com 3 parâmetros Digite o local, a escala e o limite
  2. Selecione Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura à direita) > Análise de distribuição paramétrica ou Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura arbitrária) > Análise de distribuição paramétrica.
  3. Clique em Opções.
  4. Em Usar estimativas iniciais insira a coluna de valores iniciais para o algoritmo.
  5. Em Número máximo de iterações, insira o número máximo de iterações para alcançar a convergência (o padrão é 20).

    O Minitab obtém as estimativas de máxima verossimilhança através de um processo iterativo. Se o número máximo de iterações for alcançado antes da convergência, o algoritmo será interrompido.

Especifique parâmetros para uma análise de distribuição paramétrica em vez de deixar que o Minitab faça as estimativas dos parâmetros

É possível usar qualquer um dos métodos de estimativa em Análise de distribuição paramétrica (censura à direita) e Análise de distribuição paramétrica (censura arbitrária). No entanto, em vez fazer com que o Minitab estime os parâmetros usando um desses métodos, também é possível especificar alguns parâmetros ou todos os parâmetros. Se você optar por especificar os parâmetros, os resultados calculados, como os percentis, são baseados nos valores dos parâmetros inseridos para análise.

Especifique alguns parâmetros e estime outros

Você pode especificar alguns parâmetros para a distribuição e fazer com que o Minitab estime os outros usando os dados. Normalmente você estima alguns parâmetros para efetuar uma Análise de Bayes quando os dados apresentam poucas falhas ou nenhuma falha. VejaComo efetuar uma análise de confiabilidade com poucas falhas ou nenhuma falha para mais detalhes.

  1. Selecione Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura à direita) > Análise de distribuição paramétrica ou Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura arbitrária) > Análise de distribuição paramétrica.
  2. Clique em Estimativa.
  3. Em Análise de Bayes, insira os parâmetros que deseja especificar para a distribuição. Os parâmetros a serem especificados dependem da distribuição escolhida:
    Distribuição Parâmetros que você pode especificar
    Weibull Forma
    Weibull de 3 parâmetros Forma, limite ou ambos
    Exponencial Nenhum
    Exponencial com 2 parâmetros Limite
    Outras distribuições sem um limite Escala
    Outras distribuições com limite Escala, limite ou ambos

    Você sempre estima o parâmetro de escala para a distribuição Weibull. Para distribuições que têm um parâmetro de localização, você sempre estima o parâmetro de localização.

Especificar todos os parâmetros

Você pode especificar todos os parâmetros em vez de estimá-los a partir dos dados. Você pode especificar parâmetros históricos por exemplo, para comparar as estimativas baseadas em parâmetros históricos com estimativas baseadas em dados atuais ou para ver como os dados atuais se ajustam a um gráfico de probabilidade baseado em parâmetros históricos.

  1. Na worksheet, digite estimativas de parâmetros para a distribuição em uma única coluna. Você pode digitar mais de uma coluna de estimativas de parâmetros se houver mais de uma variável a ser analisada. Para as diferentes distribuições, digite as estimativas de parâmetros na coluna, na ordem indicada por esta tabela.
    Distribuição Parâmetros
    Weibull Digite a forma e a escala
    Exponencial Digite a média
    Outras distribuições com 2 parâmetros Digite o local e a escala
    Exponencial de 2 parâmetros Digite a escala e o limite
    Weibull de 3 parâmetros Digite a forma, a escala e o limite
    Outras distribuições com 3 parâmetros Digite o local, a escala e o limite
  2. Selecione Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura à direita) > Análise de distribuição paramétrica ou Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura arbitrária) > Análise de distribuição paramétrica.
  3. Clique em Opções.
  4. Selecione Usar estimativas históricas
  5. Em Usar estimativas históricas, insira a coluna de parâmetros estimados. Se houver mais de uma variável a ser analisada, digite as colunas de estimativas na mesma ordem em que você digitou as variáveis.

Assuma parâmetros de forma ou escala comuns para análise de distribuição paramétrica

Quando você executa uma análise de distribuição paramétrica, pode fazer com que o Minitab assuma parâmetros comuns de forma ou escala para as estimativas.

  1. Selecione Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura à direita) > Análise de distribuição paramétrica ou Estat > Confiabilidade/sobrevivência > Análise de distribuição (censura arbitrária) > Análise de distribuição paramétrica.
  2. Clique em Estimativa.
  3. Em Método de Estimação, marque Assumir forma comum (inclinação-Weibull) ou escala (1/inclinação-outras distribuições).

    O Minitab assume parâmetros de forma ou escala comuns ao calcular as estimativas. Por exemplo, suponha que você tem 2 (ou mais k > 2, em geral) amostras independentes distribuídas normalmente com médias diferentes, mas a mesma variância. Para estimar a média de cada amostra, o Minitab utiliza uma estimativa agrupada da variância. Esta abordagem é generalizada para outras distribuições também. O resultado específico, entretanto, depende do método de estimativa selecionado para a análise.

Método MLE com parâmetros comuns de forma ou escala

Para o método de máxima verossimilhança, o Minitab usa a função de log-verossimilhança. Neste caso, a função de log-verossimilhança do modelo é a soma das funções de log-verossimilhança individuais, com o mesmo parâmetro de forma assumido em cada função de log-verossimilhança individual. A função de log-verossimilhança geral resultante é maximizada para obter os parâmetros de escala associados com cada grupo e o parâmetro de forma comum. Para obter mais informações, consulte a seguinte referência: W. Nelson (1982). Applied Life Data Analysis, Chapter 12. John Wiley & Sons.

Método LSE com parâmetros comuns de forma ou escala

O Minitab primeiro calcula a coordenada y e a coordenada x para cada grupo (para obter mais detalhes, consulte os tópicos "Pontos de gráfico" e "Linha ajustada" em Métodos e fórmulas para o gráfico de probabilidades em Análise de distribuição paramétrica (censura à direita). Em seguida, para obter as estimativas de LSE, o Minitab executa as seguintes etapas:

  1. Combina os dados da coordenada de x.
  2. Combina os dados da coordenada de y.
  3. Utiliza uma variável indicadora (ou Por variável) para identificar os grupos.
  4. Faz a regressão das coordenadas de x (resposta) contra os preditores definidos por todas as coordenadas de y (preditor contínuo) e a variável indicadora (preditor categórico).
    Observação

    Para distribuições de log de escala-localização (por exemplo, Weibull), as coordenadas de x devem ser transformadas em log. Os grupos devem ter a mesma inclinação, que é o inverso do parâmetro de forma comum. O parâmetro de escala de cada grupo é obtido pela exponenciação do intercepto para cada grupo.