Graphiques et statistiques d'échantillon bootstrap pour Bootstrap pour un test de moyenne à 2 échantillons

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour les statistiques et les graphiques d'échantillon bootstrap fournis avec les techniques de bootstrap pour une moyenne à 2 échantillons.

Histogramme

Un histogramme divise les valeurs des échantillons en plusieurs intervalles et représente l'effectif des valeurs contenues dans chaque intervalle par une barre.

Interprétation

Utilisez l'histogramme pour examiner la forme de votre distribution bootstrap. La distribution bootstrap est la loi de distribution de la différence entre les moyennes de chaque rééchantillonnage. La distribution bootstrap doit sembler normale. Si elle est anormale, vous ne pouvez pas faire confiance aux résultats.
50 rééchantillonnages
1 000 rééchantillonnages

La loi de distribution est généralement plus facile à déterminer avec davantage de rééchantillonnages. Par exemple, dans ces données, la loi de distribution est ambiguë pour 50 rééchantillonnages. Avec 1 000 rééchantillonnages, la forme est approximativement normale.

Sur cet histogramme, la distribution bootstrap semble normale.

Diagramme des valeurs individuelles

Un diagramme des valeurs individuelles présente les valeurs individuelles contenues dans l'échantillon. Chaque cercle représente une observation. Un diagramme des valeurs individuelles est particulièrement utile lorsque vous disposez de relativement peu d'observations et que vous avez besoin d'évaluer l'effet de chacune d'entre elles.

Remarque

Minitab affiche un diagramme des valeurs individuelles uniquement lorsque vous n'effectuez qu'un seul rééchantillonnage. Minitab affiche à la fois les données d'origine et celles du rééchantillonnage.

Interprétation

Avec un effectif d'échantillon important, l'échantillon bootstrap a généralement un milieu et une étendue semblables à ceux de l'échantillon d'origine. Cependant, un effectif d'échantillon de petite taille peut entraîner des différences entre l'échantillon bootstrap et l'échantillon d'origine. Si l'échantillon bootstrap ne ressemble pas à l'échantillon d'origine, vous devez envisager d'augmenter l'effectif d'échantillon.
Effectif de l'échantillon égal à 8
Effectif de l'échantillon égal à 50

Nombre de rééchantillonnages

Le nombre de rééchantillonnages est le nombre de fois que Minitab prélève un échantillon aléatoire avec remise dans votre ensemble de données d'origine. Généralement, un grand nombre de rééchantillonnages donne de meilleurs résultats. L'effectif d'échantillon pour chaque rééchantillonnage est égal à l'effectif d'échantillon de l'ensemble de données d'origine. Le nombre de rééchantillonnages est égal au nombre d'observations dans l'histogramme.

Moyenne

La moyenne correspond à la somme de toutes les différences entre les moyennes de l'échantillon de bootstrap divisée par le nombre de rééchantillonnages.

Interprétation

Minitab présente deux valeurs différentes pour la différence entre les moyennes, la différence des échantillons observés et celle de la distribution du bootstrap (moyenne). Ces deux valeurs sont une estimation de la différence entre les moyennes de population et sont généralement similaires. En cas de différence importante entre ces deux valeurs, vous devez augmenter l'effectif de votre échantillon d'origine.

La moyenne étant calculée à partir de données d'échantillon et non l'ensemble de la population, il est peu probable que la moyenne soit égale à la différence entre les moyennes de population. Pour mieux estimer la différence entre les moyennes de population, utilisez l'intervalle de confiance.

EcTyp (échantillon bootstrap)

L'écart type est la mesure la plus courante de la dispersion ou de la répartition des données sur la moyenne. Le symbole σ (sigma) est souvent utilisé pour représenter l'écart type d'une population, tandis que s sert à représenter l'écart type d'un échantillon. Une variation qui est aléatoire ou naturelle pour un procédé est souvent appelée un bruit. Etant donné que l'écart type utilise les mêmes unités que les données, il est généralement plus facile à interpréter que la variance.

L'écart type des échantillons bootstrap (également appelé erreur type bootstrap) est une estimation de l'écart type de la loi d'échantillonnage de la différence entre les moyennes.

Interprétation

Utilisez l'écart type pour déterminer la dispersion des différences issues des rééchantillonnages choisies par rapport à la moyenne globale des différences. Plus l'écart type est élevé, plus les différences sont dispersées. D'une manière générale, pour une loi normale, environ 68 % des valeurs se situent à moins d'un écart type de la moyenne globale des différences, 95 % des valeurs se situent à moins de deux écarts types et 99,7 % des valeurs se situent à moins de trois écarts types.

Utilisez l'erreur type des échantillons bootstrap pour déterminer avec quelle précision les différences issues des rééchantillonnages permettent d'estimer la différence entre les moyennes de population. Plus la valeur est faible, plus l'estimation de la différence de population est précise. En règle générale, plus l'écart type est grand, plus l'erreur type bootstrap sera élevée et moins l'estimation de la différence de population sera précise. En revanche, plus l'effectif d'échantillon est élevé, plus l'erreur type bootstrap de la différence sera faible et plus l'estimation de la différence de population sera précise.

Bornes et intervalle de confiance (IC)

Les intervalles de confiance reposent sur la distribution d'échantillonnage d'une statistique. Si une statistique ne dispose pas d'un biais sous forme d'estimateur d'un paramètre, sa distribution d'échantillonnage est centrée sur la valeur réelle du paramètre. Une distribution bootstrap se rapproche de la distribution d'échantillonnage de la statistique. 95 % des valeurs du milieu de la distribution bootstrap fournissent donc un intervalle de confiance à 95 % pour le paramètre. L'intervalle de confiance vous aide à évaluer la signification pratique de votre estimation pour le paramètre de population. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation.

Remarque

Minitab ne calcule pas l'intervalle de confiance lorsque le nombre de rééchantillonnages est trop petit pour obtenir un intervalle de confiance précis.

Echantillons observés

HôpitalNMoyenneEcTypVarianceMinimumMédianeMaximum
A2080,308,1866,9662,0079,0098,00
B2059,3012,43154,5435,0058,5089,00

Différence entre les moyennes observées

Moyenne de A - Moyenne de B = 21

Echantillons bootstrap pour la différence entre les moyennes

Nombre de
rééchantillonnages
MoyenneEcTypIC à 95% pour la
différence
100020,9603,279(14,400; 27,600)

Dans ces résultats, l'estimation de la différence de la population est de 20,96. Vous pouvez être sûr à 95 % que la différence moyenne de la population est comprise entre 14,4 et 27,6.