Académique Documents
Professionnel Documents
Culture Documents
1 : Théorie de l’échantillonnage
3. Distribution d’échantillonnage
Considérons un échantillon aléatoire qui est utilisé pour faire une inférence sur certaines
constituée de quatre individus ( = 4) : Pierre, Paul, Jacques et Jean. On suppose que leurs
Notons le poids d'un individu, supposé déterministe, et imaginons que notre population soit
= 65 ; = 73 ; = 82 ; = 68
poids exprimés en kilogrammes sont respectivement égaux à :
65 + 73 + 82 + 68
La moyenne du poids (poids moyen) dans la population est donnée par :
= = 72
4
Si l'on souhaite constituer un échantillon aléatoire de taille = 2 (sans remise), il convient de tirer
deux individus parmi les quatre individus de la population et d'observer leur poids moyen.
On obtient un total de 06 échantillons avec une probabilité de 1/6 d’être sélectionné pour chacun.
En fonction de l’échantillon choisi, la moyenne empirique se présente comme une variable
aléatoire. Dans ce cas il sera possible de présenter sa distribution de probabilité ou la distribution
d’échantillonnage pour les différentes moyennes empiriques de la population (les deux dernières
Le tableau suivant présente des résultats similaires pour un échantillon de taille = 3 issu de la
colonnes du tableau précédent).
champ beaucoup plus proche de la moyenne de la population = 72. On trouvera ceci vrai – la
même population que précédemment. Il faut noter que les moyennes sont concentrées dans un
Dans ces exemples, il a été possible de définir tous les échantillons possibles étant donné la taille
de la population et de l’échantillon. Et pour chaque échantillon possible, la moyenne empirique a
été calculée, et la distribution de probabilité a été construite.
De ces exemples simples, on voit que lorsque la taille de l’échantillon devient grande, la distribution
de la moyenne empirique – distribution d’échantillonnage – devient plus concentrée autour de la
moyenne de la population. Dans la plupart des travaux statistiques, les populations sont très
grandes, et il n’est souvent pas rationnel de construire la distribution de tous les échantillons
possibles d’une taille donnée. Mais en utilisant ce qu’on a appris sur les variables aléatoires, on peut
montrer que les distributions d’échantillonnage pour les échantillons de toutes populations ont des
caractéristiques similaires que celles qu’on a montré dans les exemples simples de population
discrète.
Soient les variables aléatoires !", ! , ⋯ ! d’un échantillon issu d’une population. La valeur de la
Moyenne de l’échantillon
1 1
moyenne de l’échantillon de ces variables aléatoires est définie par
!% = ' ! = (!" + ! + ⋯ + ! )
("
Considérons la distribution d’échantillonnage de la variable !%. À ce point, on ne peut pas
déterminer la forme de la distribution d’échantillonnage, mais on peut déterminer la moyenne et la
variance de la distribution d’échantillonnage à partir des définitions basiques vues dans les cours
de probabilités.
Étant une variable aléatoire, cette moyenne n’est rien d’autre que l’espérance mathématique de !%.
Moyenne de la moyenne de l’échantillon (empirique)
1 1
)*!%+ = ) , ' ! - = ) . (!" + ! + ⋯ + ! )/ = =
("
L’espérance mathématique d’une combinaison linéaire de variables aléatoires est une combinaison linéaire des
espérances
Ainsi, l’espérance mathématique de la moyenne empirique ou de l’échantillon est la moyenne de la
population. Si les échantillons de n observations aléatoires sont indépendamment et identiquement
tirés d’une population, alors lorsque le nombre d’échantillons devient grand, la moyenne des
moyennes de l’échantillon approche la vraie valeur de la moyenne de la population. Une seule
moyenne de l’échantillon peut être plus grande ou plus petite que la moyenne de la population.
Cependant, en moyenne, il n’y a pas de raison d’espérer la moyenne de l’échantillon plus grand ou plus petit que la
moyenne de la population.
Exemple :
Dans l’exemple des échantillons de 2 individus sur 4, on peut calculer l’espérance mathématique
1 1 1
de la variable aléatoire comme suit :
)*!%+ = ' ̅ 0 ( ̅ ) = (69) 2 3 + (73.5) 2 3 + ⋯ + (75) 2 3 = 72
6 6 6
Ce résultat donne la moyenne de la population .
1 1 1 1 1
coefficients linéaires au carrée multiplié par la variance des variables aléatoires. Il s’en suit que :
=
√
8̅
Cela correspond au cas où la population mère est finie et l’échantillon est non exhaustif (tirage avec
remise) ou si la population est infinie, que l’échantillon soit ou non exhaustif.
Lorsque la taille de l’échantillon n’est pas une petite fraction de la taille de population , alors
les membres individuels de l’échantillon ne sont pas distribués indépendamment. On peut montrer
dans ce cas que la variance de la moyenne de l’échantillon est comme suit :
−
567(!%) =
−1
;<
Où le facteur ;<" est appelé facteur d’exhaustivité ou facteur de correction de la population finie.
Ce cas s’applique lorsque la population mère est finie (avec n N > 1 20 ) et l’échantillon exhaustif
(tirage sans remise).
distribution d’échantillonnage. On verra qu’avec des analyses additionnelles, ces résultats peuvent
devenir très puissants pour certaines applications pratiques. On analyse d’abord ces résultats sous
l’hypothèse selon laquelle la population sous-jacente a une distribution de probabilité normale.
Ensuite, nous explorons la distribution d’échantillonnage de la moyenne d’échantillon lorsque la
population sous-jacente n’a pas une distribution normale. Ce second cas va fournir des résultats
puissants pour beaucoup d’applications pratiques en économie et en gestion.
)(!" + ! + ⋯ + ! ) = . ⟹ ) >' ! ? = .
("
̅ = ∑ (" ! ⟹ )( ̅ ) =
"
Si on pose que
De même, Pour tout , on a . Les variables aléatoires étant
indépendantes,
5( ̅ ) = ⟹ =
√
8̅
Les variables aléatoires étant indépendantes et suivant une loi normale, leur somme
suit une loi normale et ̅ = ∑ (" ! suit également une loi normale.
"
̅ suit
dire, identiquement distribuées). On dit tout simplement qu’on a variables i.i.d, admettant une
moyenne et une variance . Pour suffisamment grand, la variable aléatoire
̅− ̅− ̅−
approximativement une loi normale
(G < IJ)
5. Distribution d'échantillonnage de la moyenne empirique de petits échantillons
Pour les grands échantillons, Le théorème central limite nous dit que ̅ suit approximativement
une loi normale. Lorsque la taille de l'échantillon n'est pas grande pour appliquer le théorème
central limite, la population devra satisfaire certaines conditions telles que la normalité de la
population.
Si la population est normalement distribuée, alors:
̅− ̅− ̅−
si est connu, on a
C= = → (0, 1) ⟺ √ 2 3→ (0, 1)
8̅
√
̅− ̅− ̅−
L= = → N( − 1) ⟺ √ 2 3 → N( − 1)
8̅ M M
√
différence ( " − ), pour ce faire, on extrait deux échantillons aléatoires indépendants de tailles
respectivement. On s’intéresse à la
" ON de chaque population. Soient ̅" ON ̅ les moyennes empiriques de chaque échantillon.
Cas 1 : Si les échantillons sont de grandes tailles c'est-à-dire ( " , ≥ 30) la variable aléatoire
WR = S +
V V
U V
U V
W" W
Q→ X( " − ), Y "
+ Z EF Q → X( " − ), Y + Z
" "
Q−( "− )
Dans ce cas les variables centrées réduites sont obtenues,
→ (0, 1) W[ " ON WE N \E FOW
Y "
+
"
Q−( − )
Ou
→ (0, 1) W[ ON WE N [ \E FOW
"
"
W" W
Y +
"
Note : lorsque " ON WE N [ \E FOW on les remplace par les variances empiriques (ou des
Cas 2 : lorsque les échantillons sont de petites tailles, c'est-à-dire ( " , < 30), on suppose que
échantillons).
les populations sont normales et les écart-types sont inconnus. On utilise la loi de Student à la
6`O\
( − 1)W" + ( − 1)W
W] =
"
"+ −2
Q−( − )
→ N(b; _)
"
W" W"
Y +
"
W" W
avec
. + /
`= "
(W" ⁄ " ) (W ⁄ )
+
( " − 1) ( − 1)
utilise le nombre entier directement supérieur. Si par exemple ` = 17.35 alors le degré de liberté est de 18.
Note : dans la plupart des cas, le calcul du degré de liberté donne une valeur fractionnelle. Dans la pratique, on