A2 mesure l'aire comprise entre la ligne ajustée (qui dépend de la loi de distribution sélectionnée) et la fonction en escalier non paramétrique (qui dépend des points relevés). Plus précisément, la statistique d'Anderson-Darling est le carré d'une distance ayant une pondération plus élevée aux extrémités de la loi de distribution. Une petite valeur d'Anderson-Darling indique que la loi correspond bien aux données.
Le test de normalité d'Anderson-Darling est défini comme suit :
H0 : Les données suivent une loi normale
H1 : Les données ne suivent pas une loi normale
Terme | Description |
---|---|
F(Yi) | ![]() |
Yi | données ordonnées |
La valeur de p est une autre mesure quantitative pour reporter le résultat du test de normalité d'Anderson-Darling. Une valeur de p faible indique que l'hypothèse nulle est fausse.
Si vous connaissez A2, vous pouvez calculer la valeur de p.
Soit
Nombre de valeurs présentes dans votre échantillon.
L'écart type de l'échantillon fournit une mesure de l'étendue de vos données. Il est égal à la racine carrée de la variance de l'échantillon.
Terme | Description |
---|---|
x i | ie observation |
![]() | moyenne des observations |
N | nombre d'observations présentes |
La variance mesure le degré de dispersion des données autour de leur moyenne. Elle est égale à l'écart type au carré.
Terme | Description |
---|---|
xi | ie observation |
![]() | moyenne des observations |
N | nombre d'observations présentes |
Il s'agit d'une mesure de l'asymétrie. Une valeur négative indique une asymétrie vers la gauche, tandis qu'une valeur positive indique une asymétrie vers la droite. Une valeur nulle n'indique pas forcément une symétrie.
Terme | Description |
---|---|
xi | ie observation |
![]() | moyenne des observations |
N | nombre d'observations présentes |
s | écart type de l'échantillon |
L'aplatissement est une mesure de la différence d'une loi distribution par rapport à une loi normale. Une valeur positive indique généralement que la loi a un pic plus aigu que la distribution normale. Une valeur négative indique que la loi a un pic moins aigu que la distribution normale.
Terme | Description |
---|---|
xi | ie observation |
![]() | moyenne des observations |
N | nombre d'observations présentes |
s | écart type de l'échantillon |
La moyenne est une mesure courante du centre d'un ensemble de valeurs numériques. Il s'agit de la somme de toutes les observations divisée par le nombre d'observations (présentes).
Terme | Description |
---|---|
xi | ie observation |
N | nombre d'observations présentes |
Plus petite valeur de votre ensemble de données.
Plus grande valeur de votre ensemble de données.
25 % de vos observations d'échantillon sont inférieures ou égales à la valeur du 1er quartile. Donc, le 1er quartile est également le 25e percentile.
Terme | Description |
---|---|
y | valeur d'entier tronqué de w |
w | ![]() |
z | composant de fraction de w tronqué |
xj | je observation de la liste de données d'échantillon, classées de la plus petite à la plus grande |
Lorsque x est un entier, y = w, z = 0 et Q1 = xy.
La médiane de l'échantillon se trouve au milieu des données : au moins la moitié des observations lui est inférieure ou égale, et au moins la moitié lui est supérieure ou égale.
Supposez qu'une colonne contient N valeurs. Pour calculer la médiane, vous devez d'abord classer vos valeurs de données de la plus petite à la plus grande. Si N est impair, la médiane de l'échantillon est la valeur centrale. Si N est pair, la médiane de l'échantillon est la moyenne des deux valeurs centrales.
Par exemple, lorsque N = 5 et que vous avez les données x1, x2, x3, x4 et x5, la médiane est = x3.
Lorsque N = 6 et que vous avez classé les données x1, x2, x3, x4, x5 et x6 :
où x3 et x4 sont les troisième et quatrième observations.
75 % de vos observations d'échantillon sont inférieures ou égales à la valeur du troisième quartile. Donc, le troisième quartile est également le 75e percentile.
Terme | Description |
---|---|
y | valeur tronquée de w |
w |
![]() |
z | composant de fraction de w tronqué |
xj | je observation de la liste de données d'échantillon, classées de la plus petite à la plus grande |
Lorsque w est un entier, y = w, z = 0 et Q3 = xy.
Terme | Description |
---|---|
![]() | moyenne |
s | écart type de l'échantillon |
N | nombre de valeurs présentes |
t N, α | probabilité cumulée inverse d'une distribution en t avec N - 1 degrés de liberté à 1 – α / 2 ; α = 1 – niveau de confiance / 100 |
Minitab utilise l'interpolation linéaire pour calculer l'intervalle de confiance pour la médiane réelle 1. Cette méthode est une excellente approximation pour un grand nombre de lois symétriques, notamment la loi normale, la loi de Cauchy et la loi uniforme. Des exemples de loi asymétrique montrent des résultats adéquats qui sont toujours plus précis qu'une interpolation linéaire.
Minitab calcule un intervalle de confiance à (1 – α) 100 % pour l'écart type de la population σ. L'intervalle de confiance est très sensible à l'hypothèse de normalité des données. Même un écart mineur par rapport à la normalité peut entraîner un intervalle de confiance trompeur.
L'intervalle de confiance s'étend de :
Terme | Description |
---|---|
s | écart type |
N | nombre de valeurs présentes |
χ2N, α | probabilité cumulée inverse de χ2 avec N degrés de liberté à 1 – α / 2 ; α = 1 – niveau de confiance / 100 |