Méthodes et formules pour le diagramme de probabilité pour la fonction Analyse de répartition paramétrique (troncature à droite)

Diagramme de probabilité

Un diagramme de probabilité comprend les éléments suivants :
  • Des points, qui sont les percentiles estimés des probabilités correspondantes d'un ensemble de données trié.
  • Une droite d'ajustement, qui correspond au percentile attendu de la loi, en fonction des estimations des paramètres par le maximum de vraisemblance.
  • Des intervalles de confiance pour les percentiles.

Comme les points du diagramme ne dépendent d'aucune loi de distribution, ils sont identiques (avant d'être transformés) pour tout diagramme de probabilité tracé. En revanche, la droite d'ajustement change en fonction de la loi de distribution paramétrique choisie. Vous pouvez donc utiliser le diagramme de probabilité pour déterminer si une loi de distribution particulière convient à vos données. En général, plus vos points sont proches de la droite d'ajustement, meilleur est l'ajustement.

Points de diagramme

Les points du diagramme de probabilité représentent la vraisemblance d'une défaillance du produit avant le temps t. Pour les données tronquées à droite ou non tronquées, Minitab calcule les points du diagramme à l'aide des méthodes suivantes :
  • Méthode du rang de médiane (par défaut)
  • Méthode de Kaplan-Meier modifiée
  • Méthode de Herd-Johnson
  • Méthode de Kaplan-Meier

Si les données contiennent des défaillances survenant au même moment (temps de défaillance identiques), Minitab indique tous les points ex aequo (par défaut), leur moyenne ou leur maximum. Si les points ex aequo comprennent des défaillances et des suspensions, les défaillances sont considérées comme se produisant avant les suspensions.

Chacune de ces méthodes engendre des estimations non paramétriques de F(t), la fonction de répartition de la variable aléatoire T, qui correspond à la durée avant défaillance.

Pour un échantillon de n observations, soit x(1), x(2),..., x(n) les statistiques d'ordre, à savoir les données triées par ordre croissant. Dans ce cas, i correspond au rang de la I e observation triée x(I). Les formules correspondant à chaque méthode sont les suivantes :

Rang de médiane (méthode de Benard)

Formule pour les données non tronquées

Formule pour les données tronquées

Kaplan-Meier modifié

Formule pour les données non tronquées

Formule pour les données tronquées

Estimation de Herd-Johnson

Formule pour les données non tronquées

Formule pour les données tronquées

Estimation de limite de produit de Kaplan-Meier

Remarque

Si la plus grande observation n'est pas tronquée, la méthode de Kaplan-Meier fournit une valeur p de 1 pour la plus grande observation non tronquée. Dans ce cas, l'estimation de Kaplan-Meier pour la plus grande observation engendre un nombre ne pouvant pas être utilisé dans le diagramme. Ce problème est corrigé en recalculant le plus grand p comme étant égal à 90 % de la distance entre le p précédent et 1.

Remarque

Pour les données tronquées arbitrairement, Minitab estime les probabilités cumulées à l'aide de la méthode de Kaplan-Meier1.

Formule pour les données non tronquées

Formule pour les données tronquées

Notation

TermeDescription
irang du point ; des rangs consécutifs sont attribués aux valeurs ex aequo
nnombre d'observations dans les données
δj 0 si la j e observation est tronquée ou 1 si la j e observation n'est pas tronquée
ARi
AR0est égal à 0
p'i

Droite d'ajustement

Le tableau suivant indique comment les coordonnées x et y de la droite d'ajustement sont déterminées. Prenez note des observations suivantes :
  • Minitab transforme l'axe des x en une échelle logarithmique lorsque vous utilisez la loi de Weibull, de Weibull à 3 paramètres, exponentielle, log-normale ou log-logistique.
  • Minitab transforme l'axe des y en une échelle de pourcentages par défaut. Si vous définissez une échelle de probabilité pour l'axe des y, Minitab transforme ce dernier de façon appropriée.

Loi de distribution Coordonnée x Coordonnée y
Plus petites valeurs extrêmes moment de défaillance ln(–ln(1 – p))
Weibull ln(moment de défaillance) ln(–ln(1 – p))
Weibull à 3 paramètres ln(moment de défaillance – seuil) ln(–ln(1 – p))
Exponentielle ln(moment de défaillance) ln(–ln(1 – p))
Exponentielle à 2 paramètres ln(moment de défaillance – seuil) ln(–ln(1 – p))
Normale moment de défaillance Φ –1 (p)
Log-normale ln(moment de défaillance) Φ –1 (p)
Log-normale à 3 paramètres ln(moment de défaillance – seuil) Φ –1 (p)
Logistique moment de défaillance
Log-logistique ln(moment de défaillance)
Log-logistique à 3 paramètres ln(temps de défaillance – seuil)

Notation

TermeDescription
Φ –1 CDF inverse d'une loi normale standard
ln(x)logarithme népérien de x
1 B.W. Turnbull (1976), "The Empirical Distribution Function with Arbitrarily Grouped, Censored and Truncated Data", Journal of the Royal Statistical Society, 38, 290-295.