Adéquation de l'ajustement pour l'identification de loi individuelle

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour toutes les statistiques d'adéquation de l'ajustement fournies avec l'identification de loi individuelle.

Diagramme de probabilité

Un diagramme de probabilité affiche chaque point de données en fonction du pourcentage de valeurs dans l'échantillon qui sont inférieures ou égales.
Le diagramme comprend les éléments suivants :
Ligne centrale
Percentile attendu de la loi, en fonction des estimations des paramètres par le maximum de vraisemblance.
Bornes de confiance
Une ligne courbe placée à gauche indique les bornes inférieures des intervalles de confiance pour les percentiles. Une ligne courbe placée à droite indique les bornes supérieures des intervalles de confiance pour les percentiles.

Interprétation

Utilisez le diagramme de probabilité pour évaluer dans quelle mesure vos données suivent chaque loi.

Si la loi offre un bon ajustement pour les données, les points doivent suivre de près la ligne de distribution ajustée. Si des points s'écartent de la ligne droite, l'ajustement est inacceptable.

Ajustement correct
Ajustement incorrect

En plus du diagramme de probabilité, utilisez les mesures d'adéquation de l'ajustement, telles que les valeurs de p d'AD et les valeurs de p LRT pour évaluer l'ajustement de la loi de distribution.

Lorsque vous sélectionnez une loi pour modéliser vos données, appuyez-vous aussi sur vos connaissances du procédé. Si plusieurs lois offrent un bon ajustement, utilisez les stratégies suivantes pour faire votre choix :
  • Choisissez la loi la plus couramment utilisée dans votre secteur industriel ou pour votre application.
  • Choisissez la loi qui fournit les résultats les plus prudents. Par exemple, si vous effectuez une analyse de capabilité, vous pouvez utiliser différentes lois, puis choisir celle qui produit les indices de capabilité les plus prudents. Pour plus d'informations, reportez-vous à la rubrique Percentiles de lois pour la fonction Identification de loi individuelle et cliquez sur "Pourcentages et percentiles".
  • Choisissez la loi la plus simple pami celles qui offrent un bon ajustement à vos données. Par exemple, si une loi à 2 paramètres et une loi à 3 paramètres fournissent un bon ajustement, il est sans doute préférable de choisir la loi à 2 paramètres, plus simple.

P

Pour chaque loi, Minitab indique une valeur de p (P) pour le test d'Anderson-Darling (AD). La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Pour un test d'AD, l'hypothèse nulle est que les données suivent une loi normale. Par conséquent, des valeurs de p faibles tendent à indiquer avec plus de certitude que les données ne suivent pas la loi normale.
Remarque

Aucune valeur de p n'est disponible pour le test d'AD pour les lois à 3 paramètres, sauf pour la loi de Weibull.

Interprétation

Utilisez la valeur de p pour évaluer l'ajustement de la loi.

Comparez la valeur de p pour chaque loi de distribution ou transformation au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort que les données ne suivent pas la loi.
P ≤ α : les données ne suivent pas la loi (rejetez H0)
Si la valeur de p est inférieure ou égale au seuil de signification, vous devez rejeter l'hypothèse nulle et en conclure que les données ne suivent pas la loi de distribution.
P > α : impossible de conclure que les données ne suivent pas la loi (impossible de rejeter H0)
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas rejeter l'hypothèse nulle. Vous n'êtes pas en mesure de conclure que les données ne suivent pas la loi. Vous pouvez considérer que les données suivent la loi.
Lorsque vous sélectionnez une loi pour modéliser vos données, appuyez-vous aussi sur vos connaissances du procédé. Si plusieurs lois offrent un bon ajustement, utilisez les stratégies suivantes pour faire votre choix :
  • Choisissez la loi la plus couramment utilisée dans votre secteur industriel ou pour votre application.
  • Choisissez la loi qui fournit les résultats les plus prudents. Par exemple, si vous effectuez une analyse de capabilité, vous utiliser différentes lois, puis choisir celle qui produit les indices de capabilité les plus prudents. Pour plus d'informations, reportez-vous à la rubrique Percentiles de lois pour la fonction Identification de loi individuelle et cliquez sur "Pourcentages et percentiles".
  • Choisissez la loi la plus simple pami celles qui offrent un bon ajustement à vos données. Par exemple, si une loi à 2 paramètres et une loi à 3 paramètres fournissent un bon ajustement, il est sans doute préférable de choisir la loi à 2 paramètres, plus simple.
Important

Soyez prudent lorsque vous interprétez des résultats à partir d'un échantillon très petit ou très grand. En présence d'un très petit échantillon, un test d'adéquation de l'ajustement peut ne pas être assez puissant pour détecter des écarts significatifs par rapport à la loi. En présence d'un très grand échantillon, le test peut être si puissant qu'il détecte même de petits écarts sans signification pratique par rapport à la loi. En plus des valeurs de p, utilisez les diagrammes de probabilité pour évaluer l'ajustement de la loi de distribution.

Identification de la loi de Calcium

Exponentielle 2 paramètres

* ATTENTION * La matrice de variance/covariance des paramètres estimés n'existe pas. Le paramètre de seuil est considéré comme fixe lors du calcul des intervalles de confiance. Gamma 3 paramètres
* ATTENTION * La matrice de variance/covariance des paramètres estimés n'existe pas. Le paramètre de seuil est considéré comme fixe lors du calcul des intervalles de confiance. Diagramme d'identification de répartition de Calcium

Diagramme d'identification de répartition de Calcium

Diagramme d'identification de répartition de Calcium

Diagramme d'identification de répartition de Calcium

Statistiques descriptives N N* Moyenne EcTyp Médiane Minimum Maximum Asymétrie Aplatissement 50 0 50,782 2,76477 50,4 46,8 58,1 0,644923 -0,287071
Transformation de Box-Cox : λ = -4 Fonction de transformation de Johnson : 0,804604 + 0,893699 × Ln( ( X - 46,2931 ) / ( 59,8636 - X ) )
Test d'adéquation de l'ajustement Valeur Loi de distribution AD P de P LRT Normale 0,754 0,046 Transformation de Box-Cox 0,414 0,324 Log-normale 0,650 0,085 Log-normale à 3 paramètres 0,341 * 0,017 Exponentielle 20,614 <0,003 Exponentielle 2 paramètres 1,684 0,014 0,000 Weibull 1,442 <0,010 Weibull 3 paramètres 0,230 >0,500 0,000 Plus petite valeur extrême 1,656 <0,010 Plus grande valeur extrême 0,394 >0,250 Gamma 0,702 0,071 Gamma 3 paramètres 0,268 * 0,006 Logistique 0,726 0,034 Log-logistique 0,659 0,050 Log-logistique 3 paramètres 0,432 * 0,027 Transformation de Johnson 0,124 0,986
Estimations de MaxV des paramètres de distribution Loi de distribution Emplacement Forme Echelle Seuil Normal* 50,78200 2,76477 Transformation de Box-Cox* 0,00000 0,00000 Log-normale* 3,92612 0,05368 Log-normale à 3 paramètres 1,69295 0,46849 44,74011 Exponentielle 50,78200 Exponentielle 2 paramètres 4,06326 46,71873 Weibull 17,82470 52,13681 Weibull 3 paramètres 1,47605 4,53647 46,66579 Plus petite valeur extrême 52,22257 2,95894 Plus grande valeur extrême 49,50370 2,16992 Gamma 351,04421 0,14466 Gamma 3 paramètres 2,99218 1,63698 45,88376 Logistique 50,57182 1,59483 Log-logistique 3,92259 0,03121 Log-logistique 3 paramètres 1,54860 0,32763 45,46180 Transformation de Johnson* 0,02897 0,97293 * Echelle : estimation ajustée de MaxV

Dans ces résultats, plusieurs lois présentent une valeur de p supérieure à 0,05. La loi de Weibull à 3 paramètres (p > 0,500) et la loi des plus grandes valeurs extrêmes (p > 0,250) sont celles qui ont les valeurs de p les plus grandes et semblent mieux ajustées que les autres aux données échantillons. De plus, la transformation de Box-Cox (p = 0,324) et la transformation de Johnson (p = 0,986) transforment efficacement les données pour qu'elles suivent une loi normale.

Remarque

Pour plusieurs lois de distributions, Minitab affiche également les résultats correspondant à la même loi, mais avec un paramètre supplémentaire. Par exemple, pour la loi log-normale, Minitab affiche les résultats des versions à 2 et 3 paramètres. Pour les lois avec des paramètres en plus, utilisez la valeur de p du test de rapport de vraisemblance (p LRT) pour déterminer si l'ajout du paramètre supplémentaire améliore l'ajustement de la loi de façon significative. Une valeur de p LRT inférieure à 0,05 suggère que l'amélioration de l'ajustement est significative. Pour plus d'informations, reportez-vous à la section sur la valeur de p LRT.

Valeur de P LRT

Pour plusieurs lois de distribution, Minitab affiche également les résultats correspondant à la même loi, mais avec un paramètre supplémentaire. Pour chaque version avec un paramètre supplémentaire d'une loi, Minitab indique la valeur de p pour le test de rapport de vraisemblance (p LRT). Une valeur de p est une probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Pour le test de rapport de vraisemblance utilisé dans l'identification de loi individuelle, l'hypothèse nulle est que les données suivent la loi la plus petite (celle qui a le plus petit nombre de paramètres). Par conséquent, plus les valeurs de p LRT sont faibles, plus vous pouvez être certain que l'ajustement de la loi est significativement amélioré avec un paramètre supplémentaire.

Interprétation

Dans ces cas-là, utilisez la valeur de p LRT pour déterminer si l'ajout du paramètre supplémentaire améliore l'ajustement de façon significative par rapport à la plus petite loi.

Pour chaque loi de distribution ou transformation, comparez la valeur de p LRT au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort que le paramètre supplémentaire améliore significativement l'ajustement de la loi.
p ≤ α : la loi de distribution la plus grande (celle qui a le plus grand nombre de paramètres) améliore l'ajustement de façon significative (rejetez H0)
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez rejeter l'hypothèse nulle et conclure que l'ajustement de la loi de distribution est significativement amélioré avec l'utilisation d'un paramètre supplémentaire.
p > α : impossible de conclure que la loi de distribution la plus grande (celle qui a le plus grand nombre de paramètres) améliore l'ajustement de façon significative (impossible de rejeter H0)
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas rejeter l'hypothèse nulle. Vous n'êtes pas en mesure de conclure que l'ajustement de la loi de distribution est significativement amélioré avec l'utilisation d'un paramètre supplémentaire.

La valeur de p LRT est également utile pour les lois à 3 paramètres pour lesquelles aucune méthode n'a été mise en place afin de calculer la valeur de p. Dans ces situations, il est recommandé d'examiner la valeur de p de la loi à 2 paramètres correspondante. Il convient ensuite d'observer la valeur de p LRT de la loi à 3 paramètres, afin de déterminer si la loi à 3 paramètres est significativement meilleure que la loi à 2 paramètres.

Dans ces résultats, les valeurs de p LRT pour la loi log-normale à 3 paramètres (0,017), la loi de Weibull à 3 paramètres (0,000), la loi gamma à 3 paramètres (0,006) et la loi log-logistique à 3 paramètres (0,027) suggèrent que ces lois offrent un ajustement significativement meilleur par rapport aux lois à 2 paramètres correspondantes.

Identification de la loi de Calcium

Exponentielle 2 paramètres

* ATTENTION * La matrice de variance/covariance des paramètres estimés n'existe pas. Le paramètre de seuil est considéré comme fixe lors du calcul des intervalles de confiance. Gamma 3 paramètres
* ATTENTION * La matrice de variance/covariance des paramètres estimés n'existe pas. Le paramètre de seuil est considéré comme fixe lors du calcul des intervalles de confiance. Diagramme d'identification de répartition de Calcium

Diagramme d'identification de répartition de Calcium

Diagramme d'identification de répartition de Calcium

Diagramme d'identification de répartition de Calcium

Statistiques descriptives N N* Moyenne EcTyp Médiane Minimum Maximum Asymétrie Aplatissement 50 0 50,782 2,76477 50,4 46,8 58,1 0,644923 -0,287071
Transformation de Box-Cox : λ = -4 Fonction de transformation de Johnson : 0,804604 + 0,893699 × Ln( ( X - 46,2931 ) / ( 59,8636 - X ) )
Test d'adéquation de l'ajustement Valeur Loi de distribution AD P de P LRT Normale 0,754 0,046 Transformation de Box-Cox 0,414 0,324 Log-normale 0,650 0,085 Log-normale à 3 paramètres 0,341 * 0,017 Exponentielle 20,614 <0,003 Exponentielle 2 paramètres 1,684 0,014 0,000 Weibull 1,442 <0,010 Weibull 3 paramètres 0,230 >0,500 0,000 Plus petite valeur extrême 1,656 <0,010 Plus grande valeur extrême 0,394 >0,250 Gamma 0,702 0,071 Gamma 3 paramètres 0,268 * 0,006 Logistique 0,726 0,034 Log-logistique 0,659 0,050 Log-logistique 3 paramètres 0,432 * 0,027 Transformation de Johnson 0,124 0,986
Estimations de MaxV des paramètres de distribution Loi de distribution Emplacement Forme Echelle Seuil Normal* 50,78200 2,76477 Transformation de Box-Cox* 0,00000 0,00000 Log-normale* 3,92612 0,05368 Log-normale à 3 paramètres 1,69295 0,46849 44,74011 Exponentielle 50,78200 Exponentielle 2 paramètres 4,06326 46,71873 Weibull 17,82470 52,13681 Weibull 3 paramètres 1,47605 4,53647 46,66579 Plus petite valeur extrême 52,22257 2,95894 Plus grande valeur extrême 49,50370 2,16992 Gamma 351,04421 0,14466 Gamma 3 paramètres 2,99218 1,63698 45,88376 Logistique 50,57182 1,59483 Log-logistique 3,92259 0,03121 Log-logistique 3 paramètres 1,54860 0,32763 45,46180 Transformation de Johnson* 0,02897 0,97293 * Echelle : estimation ajustée de MaxV
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique