Un histogramme divise les valeurs des échantillons en plusieurs intervalles et représente l'effectif des valeurs contenues dans chaque intervalle par une barre.
Un diagramme des valeurs individuelles présente les valeurs individuelles contenues dans l'échantillon. Chaque cercle représente une observation. Un diagramme des valeurs individuelles est particulièrement utile lorsque vous disposez de relativement peu d'observations et que vous avez besoin d'évaluer l'effet de chacune d'entre elles.
Minitab affiche un diagramme des valeurs individuelles uniquement lorsque vous n'effectuez qu'un seul rééchantillonnage. Minitab affiche à la fois les données d'origine et celles du rééchantillonnage.
Le nombre de rééchantillonnages est le nombre de fois que Minitab prélève un échantillon aléatoire avec remise dans votre ensemble de données d'origine. Généralement, un grand nombre de rééchantillonnages donne de meilleurs résultats. L'effectif d'échantillon pour chaque rééchantillonnage est égal à l'effectif d'échantillon de l'ensemble de données d'origine. Le nombre de rééchantillonnages est égal au nombre d'observations dans l'histogramme.
La moyenne correspond à la somme de toutes les différences entre les moyennes de l'échantillon de bootstrap divisée par le nombre de rééchantillonnages.
Minitab présente deux valeurs différentes pour la différence entre les moyennes, la différence des échantillons observés et celle de la distribution du bootstrap (moyenne). Ces deux valeurs sont une estimation de la différence entre les moyennes de population et sont généralement similaires. En cas de différence importante entre ces deux valeurs, vous devez augmenter l'effectif de votre échantillon d'origine.
La moyenne étant calculée à partir de données d'échantillon et non l'ensemble de la population, il est peu probable que la moyenne soit égale à la différence entre les moyennes de population. Pour mieux estimer la différence entre les moyennes de population, utilisez l'intervalle de confiance.
L'écart type est la mesure la plus courante de la dispersion ou de la répartition des données sur la moyenne. Le symbole σ (sigma) est souvent utilisé pour représenter l'écart type d'une population, tandis que s sert à représenter l'écart type d'un échantillon. Une variation qui est aléatoire ou naturelle pour un procédé est souvent appelée un bruit. Etant donné que l'écart type utilise les mêmes unités que les données, il est généralement plus facile à interpréter que la variance.
L'écart type des échantillons bootstrap (également appelé erreur type bootstrap) est une estimation de l'écart type de la loi d'échantillonnage de la différence entre les moyennes.
Utilisez l'écart type pour déterminer la dispersion des différences issues des rééchantillonnages choisies par rapport à la moyenne globale des différences. Plus l'écart type est élevé, plus les différences sont dispersées. D'une manière générale, pour une loi normale, environ 68 % des valeurs se situent à moins d'un écart type de la moyenne globale des différences, 95 % des valeurs se situent à moins de deux écarts types et 99,7 % des valeurs se situent à moins de trois écarts types.
Utilisez l'erreur type des échantillons bootstrap pour déterminer avec quelle précision les différences issues des rééchantillonnages permettent d'estimer la différence entre les moyennes de population. Plus la valeur est faible, plus l'estimation de la différence de population est précise. En règle générale, plus l'écart type est grand, plus l'erreur type bootstrap sera élevée et moins l'estimation de la différence de population sera précise. En revanche, plus l'effectif d'échantillon est élevé, plus l'erreur type bootstrap de la différence sera faible et plus l'estimation de la différence de population sera précise.
Les intervalles de confiance reposent sur la distribution d'échantillonnage d'une statistique. Si une statistique ne dispose pas d'un biais sous forme d'estimateur d'un paramètre, sa distribution d'échantillonnage est centrée sur la valeur réelle du paramètre. Une distribution bootstrap se rapproche de la distribution d'échantillonnage de la statistique. 95 % des valeurs du milieu de la distribution bootstrap fournissent donc un intervalle de confiance à 95 % pour le paramètre. L'intervalle de confiance vous aide à évaluer la signification pratique de votre estimation pour le paramètre de population. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation.
Minitab ne calcule pas l'intervalle de confiance lorsque le nombre de rééchantillonnages est trop petit pour obtenir un intervalle de confiance précis.
Hôpital | N | Moyenne | EcTyp | Variance | Minimum | Médiane | Maximum |
---|---|---|---|---|---|---|---|
A | 20 | 80,30 | 8,18 | 66,96 | 62,00 | 79,00 | 98,00 |
B | 20 | 59,30 | 12,43 | 154,54 | 35,00 | 58,50 | 89,00 |
Moyenne de A - Moyenne de B = 21 |
---|
Nombre de rééchantillonnages | Moyenne | EcTyp | IC à 95% pour la différence |
---|---|---|---|
1000 | 20,960 | 3,279 | (14,400; 27,600) |
Dans ces résultats, l'estimation de la différence de la population est de 20,96. Vous pouvez être sûr à 95 % que la différence moyenne de la population est comprise entre 14,4 et 27,6.