Adéquation de l'ajustement pour Identification de loi individuelle

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour toutes les statistiques d'adéquation de l'ajustement fournies avec l'identification de loi individuelle.

Diagramme de probabilité

Un diagramme de probabilité affiche chaque point de données en fonction du pourcentage de valeurs dans l'échantillon qui sont inférieures ou égales.
Le diagramme comprend les éléments suivants :
Ligne centrale
Percentile attendu de la loi, en fonction des estimations des paramètres par le maximum de vraisemblance.
Bornes de confiance
Une ligne courbe placée à gauche indique les bornes inférieures des intervalles de confiance pour les percentiles. Une ligne courbe placée à droite indique les bornes supérieures des intervalles de confiance pour les percentiles.

Interprétation

Utilisez le diagramme de probabilité pour évaluer dans quelle mesure vos données suivent chaque loi.

Si la loi offre un bon ajustement pour les données, les points doivent suivre de près la ligne de distribution ajustée. Si des points s'écartent de la ligne droite, l'ajustement est inacceptable.

Ajustement correct
Ajustement incorrect

En plus du diagramme de probabilité, utilisez les mesures d'adéquation de l'ajustement, telles que les valeurs de p d'AD et les valeurs de p LRT pour évaluer l'ajustement de la loi de distribution.

Lorsque vous sélectionnez une loi pour modéliser vos données, appuyez-vous aussi sur vos connaissances du procédé. Si plusieurs lois offrent un bon ajustement, utilisez les stratégies suivantes pour faire votre choix :
  • Choisissez la loi la plus couramment utilisée dans votre secteur industriel ou pour votre application.
  • Choisissez la loi qui fournit les résultats les plus prudents. Par exemple, si vous effectuez une analyse de capabilité, vous pouvez utiliser différentes lois, puis choisir celle qui produit les indices de capabilité les plus prudents. Pour plus d'informations, reportez-vous à la rubrique Percentiles de loi pour Identification de loi individuelle et cliquez sur "Pourcentages et percentiles".
  • Choisissez la loi la plus simple pami celles qui offrent un bon ajustement à vos données. Par exemple, si une loi à 2 paramètres et une loi à 3 paramètres fournissent un bon ajustement, il est sans doute préférable de choisir la loi à 2 paramètres, plus simple.

P

Pour chaque loi, Minitab indique une valeur de p (P) pour le test d'Anderson-Darling (AD). La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Pour un test d'AD, l'hypothèse nulle est que les données suivent une loi normale. Par conséquent, des valeurs de p faibles tendent à indiquer avec plus de certitude que les données ne suivent pas la loi normale.
Remarque

Aucune valeur de p n'est disponible pour le test d'AD pour les lois à 3 paramètres, sauf pour la loi de Weibull.

Interprétation

Utilisez la valeur de p pour évaluer l'ajustement de la loi.

Comparez la valeur de p pour chaque loi de distribution ou transformation au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort que les données ne suivent pas la loi.
P ≤ α : les données ne suivent pas la loi (rejetez H0)
Si la valeur de p est inférieure ou égale au seuil de signification, vous devez rejeter l'hypothèse nulle et en conclure que les données ne suivent pas la loi de distribution.
P > α : impossible de conclure que les données ne suivent pas la loi (impossible de rejeter H0)
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas rejeter l'hypothèse nulle. Vous n'êtes pas en mesure de conclure que les données ne suivent pas la loi. Vous pouvez considérer que les données suivent la loi.
Lorsque vous sélectionnez une loi pour modéliser vos données, appuyez-vous aussi sur vos connaissances du procédé. Si plusieurs lois offrent un bon ajustement, utilisez les stratégies suivantes pour faire votre choix :
  • Choisissez la loi la plus couramment utilisée dans votre secteur industriel ou pour votre application.
  • Choisissez la loi qui fournit les résultats les plus prudents. Par exemple, si vous effectuez une analyse de capabilité, vous utiliser différentes lois, puis choisir celle qui produit les indices de capabilité les plus prudents. Pour plus d'informations, reportez-vous à la rubrique Percentiles de loi pour Identification de loi individuelle et cliquez sur "Pourcentages et percentiles".
  • Choisissez la loi la plus simple pami celles qui offrent un bon ajustement à vos données. Par exemple, si une loi à 2 paramètres et une loi à 3 paramètres fournissent un bon ajustement, il est sans doute préférable de choisir la loi à 2 paramètres, plus simple.
Important

Soyez prudent lorsque vous interprétez des résultats à partir d'un échantillon très petit ou très grand. En présence d'un très petit échantillon, un test d'adéquation de l'ajustement peut ne pas être assez puissant pour détecter des écarts significatifs par rapport à la loi. En présence d'un très grand échantillon, le test peut être si puissant qu'il détecte même de petits écarts sans signification pratique par rapport à la loi. En plus des valeurs de p, utilisez les diagrammes de probabilité pour évaluer l'ajustement de la loi de distribution.

Test d'adéquation de l'ajustement

Loi de distributionADPValeur
de P LRT
Normale0,7540,046 
Transformation de Box-Cox0,4140,324 
Log-normale0,6500,085 
Log-normale à 3 paramètres0,341*0,017
Exponentielle20,614<0,003 
Exponentielle 2 paramètres1,6840,0140,000
Weibull1,442<0,010 
Weibull 3 paramètres0,230>0,5000,000
Plus petite valeur extrême1,656<0,010 
Plus grande valeur extrême0,394>0,250 
Gamma0,7020,071 
Gamma 3 paramètres0,268*0,006
Logistique0,7260,034 
Log-logistique0,6590,050 
Log-logistique 3 paramètres0,432*0,027
Transformation de Johnson0,1240,986 

Dans ces résultats, plusieurs lois présentent une valeur de p supérieure à 0,05. La loi de Weibull à 3 paramètres (p > 0,500) et la loi des plus grandes valeurs extrêmes (p > 0,250) sont celles qui ont les valeurs de p les plus grandes et semblent mieux ajustées que les autres aux données échantillons. De plus, la transformation de Box-Cox (p = 0,324) et la transformation de Johnson (p = 0,986) transforment efficacement les données pour qu'elles suivent une loi normale.

Remarque

Pour plusieurs lois de distributions, Minitab affiche également les résultats correspondant à la même loi, mais avec un paramètre supplémentaire. Par exemple, pour la loi log-normale, Minitab affiche les résultats des versions à 2 et 3 paramètres. Pour les lois avec des paramètres en plus, utilisez la valeur de p du test de rapport de vraisemblance (p LRT) pour déterminer si l'ajout du paramètre supplémentaire améliore l'ajustement de la loi de façon significative. Une valeur de p LRT inférieure à 0,05 suggère que l'amélioration de l'ajustement est significative. Pour plus d'informations, reportez-vous à la section sur la valeur de p LRT.

Valeur de P LRT

Pour plusieurs lois de distribution, Minitab affiche également les résultats correspondant à la même loi, mais avec un paramètre supplémentaire. Pour chaque version avec un paramètre supplémentaire d'une loi, Minitab indique la valeur de p pour le test de rapport de vraisemblance (p LRT). Une valeur de p est une probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Pour le test de rapport de vraisemblance utilisé dans l'identification de loi individuelle, l'hypothèse nulle est que les données suivent la loi la plus petite (celle qui a le plus petit nombre de paramètres). Par conséquent, plus les valeurs de p LRT sont faibles, plus vous pouvez être certain que l'ajustement de la loi est significativement amélioré avec un paramètre supplémentaire.

Interprétation

Dans ces cas-là, utilisez la valeur de p LRT pour déterminer si l'ajout du paramètre supplémentaire améliore l'ajustement de façon significative par rapport à la plus petite loi.

Pour chaque loi de distribution ou transformation, comparez la valeur de p LRT au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort que le paramètre supplémentaire améliore significativement l'ajustement de la loi.
p ≤ α : la loi de distribution la plus grande (celle qui a le plus grand nombre de paramètres) améliore l'ajustement de façon significative (rejetez H0)
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez rejeter l'hypothèse nulle et conclure que l'ajustement de la loi de distribution est significativement amélioré avec l'utilisation d'un paramètre supplémentaire.
p > α : impossible de conclure que la loi de distribution la plus grande (celle qui a le plus grand nombre de paramètres) améliore l'ajustement de façon significative (impossible de rejeter H0)
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas rejeter l'hypothèse nulle. Vous n'êtes pas en mesure de conclure que l'ajustement de la loi de distribution est significativement amélioré avec l'utilisation d'un paramètre supplémentaire.

La valeur de p LRT est également utile pour les lois à 3 paramètres pour lesquelles aucune méthode n'a été mise en place afin de calculer la valeur de p. Dans ces situations, il est recommandé d'examiner la valeur de p de la loi à 2 paramètres correspondante. Il convient ensuite d'observer la valeur de p LRT de la loi à 3 paramètres, afin de déterminer si la loi à 3 paramètres est significativement meilleure que la loi à 2 paramètres.

Dans ces résultats, les valeurs de p LRT pour la loi log-normale à 3 paramètres (0,017), la loi de Weibull à 3 paramètres (0,000), la loi gamma à 3 paramètres (0,006) et la loi log-logistique à 3 paramètres (0,027) suggèrent que ces lois offrent un ajustement significativement meilleur par rapport aux lois à 2 paramètres correspondantes.

Test d'adéquation de l'ajustement

Loi de distributionADPValeur
de P LRT
Normale0,7540,046 
Transformation de Box-Cox0,4140,324 
Log-normale0,6500,085 
Log-normale à 3 paramètres0,341*0,017
Exponentielle20,614<0,003 
Exponentielle 2 paramètres1,6840,0140,000
Weibull1,442<0,010 
Weibull 3 paramètres0,230>0,5000,000
Plus petite valeur extrême1,656<0,010 
Plus grande valeur extrême0,394>0,250 
Gamma0,7020,071 
Gamma 3 paramètres0,268*0,006
Logistique0,7260,034 
Log-logistique0,6590,050 
Log-logistique 3 paramètres0,432*0,027
Transformation de Johnson0,1240,986