Méthodes pour la fonction Identification de loi individuelle

Sur ce thème

Estimations par le maximum de vraisemblance
Test d'adéquation de l'ajustement
Test de rapport de vraisemblance

Estimations par le maximum de vraisemblance

Les estimations des paramètres par la méthode du maximum de vraisemblance sont calculées par maximisation de la fonction de vraisemblance par rapport aux paramètres. Pour un ensemble de données particulier, la fonction de vraisemblance d'une loi estime la probabilité de générer des données suivant cette loi.

L'algorithme de Newton-Raphson permet de calculer les estimations des paramètres qui définissent la loi de distribution par maximum de vraisemblance. Il s'agit d'une méthode récursive utilisée pour calculer le maximum d'une fonction¹ Les percentiles sont ensuite calculés à partir de cette loi de distribution.

Remarque

Minitab calcule les estimations des paramètres à l'aide de la méthode du maximum de vraisemblance pour toutes les lois, à l'exception de la loi normale et de la loi log-normale. Pour la loi normale et la loi log-normale, Minitab calcule des estimations de paramètres non biaisées.

Test d'adéquation de l'ajustement

Minitab utilise les statistiques d'Anderson-Darling pour effectuer le test d'adéquation de l'ajustement.

Soit Z = F(X), où F(X) représente la fonction de répartition. Supposons qu'un échantillon X₁, .., X_n donne les valeurs Z₍_i) = F(X_i), i=1,.., n. Triez Z_(i) par ordre croissant, Z₍₁₎ < Z₍₂₎ <...<Z₍_n₎. La statistique d'Anderson-Darling (A²) isest alors calculée comme suit :

A² = –n - (1/n) Σ_i[(2i – 1) log Z_(i) + (2n + 1 – 2i) log (1 – Z_(i))]

La statistique du test d'adéquation de l'ajustement d'Anderson-Darling modifiée est calculée pour chaque loi. Les valeurs de p sont basées sur les tableaux 4.8−4.22 présentés par D'Agostino et Stephens² Si le tableau ne contient aucune valeur de p exacte, Minitab calcule la valeur de p basée sur l'interpolation à l'aide de l'étendue de la valeur de p.

Remarque

Les valeurs de p pour le test d'Anderson-Darling ne sont pas disponibles pour les lois à 3 paramètres, sauf pour la loi de Weibull.

Test de rapport de vraisemblance

Le test de rapport de vraisemblance compare l'ajustement d'une famille de lois à celui d'un sous-ensemble de cette même famille et détermine si la famille élargie offre une réelle amélioration de l'ajustement. Par exemple, pour une loi exponentielle à 2 paramètres, le test de rapport de vraisemblance compare l'ajustement de la famille des lois exponentielles à 2 paramètres à celui de la famille des lois exponentielles à 1 paramètre (sous-ensemble où le second paramètre est égal à 0). Si une loi exponentielle à 2 paramètres améliore significativement l'ajustement, la valeur de p associée à la statistique du test de rapport de vraisemblance est très faible.

La statistique du test de rapport de vraisemblance est calculée comme suit.

Soit A l'estimation par le maximum de vraisemblance (EMaxV) du vecteur de paramètre de la famille de lois élargie (par exemple, la famille des lois à 3 paramètres) et L(A) le log de vraisemblance. Soit B l'estimation par maximum de vraisemblance du vecteur de paramètre pour la famille de lois restreinte correspondante (par exemple, la famille des lois à 2 paramètres correspondante) et L(B) le log de vraisemblance.

Statistique du test de rapport de vraisemblance = 2 * L(A) 2 * L(B).

Sous l'hypothèse nulle, la famille de lois la plus restreinte est bien ajustée aux données. La statistique du test de rapport de vraisemblance suit une loi du Khi deux où DL = dimension du vecteur (A) – dimension du vecteur (B).

¹ W. Murray, éd. (1972), Numerical Methods for Unconstrained Optimization, Academic Press.

² M.A. Stephens (1986). Chapter 4: Tests based on EDF statistics. Goodness-of-Fit Techniques, ed. R.B. D'Agostino et M.A. Stephens.Marcel Dekker, Inc. 97-193.