Vous êtes sur la page 1sur 5

Echantillonnage

____________
1 Le problème de l’échantillonnage
Il s’agit de déterminer des propriétés concernant des échantillons prélevés dans une
population donnée.
Nous ne considérons ici que des échantillons aléatoires, c'est-à-dire constitués d’éléments pris
au hasard dans la population.

Pour former un échantillon de taille n :


– Le tirage des n éléments de la population peut être sans remise ou exhaustif : n fois de
suite, on tire au hasard un élément de la population pour noter un résultat le
concernant , sans le remettre dans cette population.
On a une suite de n prélèvements d’un élément dans la population qui ne sont pas
indépendants les uns des autres.
– Le tirage des n éléments de la population peut être avec remise ou non exhaustif : n
fois de suite, on tire au hasard un élément de la population pour noter un résultat le
concernant, on le remet ensuite dans cette population.
On a une suite de n prélèvements d’un élément dans la population qui sont
indépendants les uns des autres.

2 Étude de la moyenne d’un échantillon

On considère une population sur laquelle est définie une variable numérique X de moyenne ou
d’espérance m et d’écart type .

Prélevons dans cette population un échantillon aléatoire de taille n, le tirage de ces n éléments
est avec remise ou non exhaustif.
Considérons les n variables aléatoires X1, X2, …, Xn où Xi donne la valeur fournie par X, à
l’élément obtenu au ième tirage.

Les n variables aléatoires X1, X2, …, Xn sont indépendantes et suivent la même loi de
probabilité (celle fournie par X ) et ont toutes la même espérance m et le même écart type 
1
La variable aléatoire X  ( X 1  X 2  ...  X n ) associe à cet échantillon sa moyenne
n
(concernant la variable numérique X).

D’après le chapitre précédent, on a les résultats suivants :



① X est une variable aléatoire d’espérance m et d’écart type .
n

② Si X suit la loi normale N (m ; ), X suit la loi normale N (m ; ).
n

③ Pour n suffisamment grand, X suit approximativement la loi normale N (m ; ).
n

Remarque : Dans la plupart des cas où la population a un grand effectif dont on tire une faible
proportion d’éléments, on assimile un tirage sans remise à un tirage avec remise.
3 Étude d’exemples

Énoncés

① Une machine fabrique des pièces de forme circulaire en grande série. A chaque pièce tirée
au hasard, on associe son diamètre exprimée en millimètres ; on définit ainsi une variable
aléatoire X.
On suppose que X suit la loi normale N (  ; ) où 150 et = 0,21.
Soit M la variable aléatoire qui, à chaque échantillon de 400 pièces prélevées au hasard et
avec remise, associe la moyenne des diamètres des pièces de cet échantillon.
a) Déterminer la loi suivie par la variable aléatoire M .
b) Déterminer le nombre positif h tel que P(– h ≤ M ≤  + h ) = 0,95.

② Une machine fabrique des pièces en grande série. À chaque pièce tirée au hasard, on
associe sa longueur exprimée en millimètres ; on définit ainsi une variable aléatoire X.
On suppose que X suit la loi normale N ( m ; ) où met= 0,027.
Soit M la variable aléatoire qui, à tout échantillon aléatoire non exhaustif de taille n, associe la
moyenne des longueurs des pièces de l’échantillon.
a) Déterminer la loi suivie par la variable aléatoire M .
b) Déterminer n pour que P( 8,195 ≤ M ≤  ) ≥ 0,95.

Corrigés

 0,21 M  150
① a)  =0,0105 et M suit la loi normale N (150 ; 0,0105) ; T= suit la loi
400 20 0,0105
normale N (0 ; 1).
b) Avec 0< h,
h M µ h
P(– h ≤ M ≤  + h ) = P ( -h <M–µ=M–150< h) =P (  T   )
0,0105 0,0105 0,0105
h
soit P(– h ≤ M ≤  + h ) = 2  ) – 1.
0,0105
____________________________________
h h h
2  ) – 1 pour 2  ) = 1,95 soit pour  ) = 0,9750 .
0,0105 0,0105 0,0105
______________________________________
Avec les tables numériques, on fait l’approximation suivante :
h
P(– h ≤ M ≤  + h ) pour = 1,96 soit pour h = 0,02 058 .
0,0105

 0,027
② a) M suit la loi normale N ( m ; ) =  N ( 28,2 ; ).
n n
M  28,2 n
b) T =  ( M  28,2) suit la loi normale N (0 ;1).
0,027 / n 0,027
Soit q = P( 28,195  M  28,205), on fait intervenir des probabilités d’événements
équivalents : q = P ( -0,005 < M – 28,2<0,005) soit :
n n n
q = P( -0,005 <T= (M–28,2)<0,005 ) d’où
0,027 0,027 0,027
5 5 5
q= P( - n T  n ) = 2 ( n ) –1
27 27 27
5 5
ainsi 0,95 < q  1,95 < 2 ( n )  0,9750 < ( n ).
27 27
___________________________

5 5
On fait l’approximation 0,9750=  1,96) et ainsi 0,9750 < ( n ) pour 1,96 < n,
27 27
1,96  27 1,96  27 2 1,96  27
soit pour  n , ou encore ( ) < n où ≈ 112,02
5 5 5

Finalement 0,95 < q pour 113 < n.

Finalement 0,95 < P( 28,195  M  28,205) pour 113 < n .


4 Étude de la fréquence d’une propriété
On considère une population dont une proportion p de la population possède une certaine
propriété.

∗ On fait un tirage non exhaustif dans la population pour former un échantillon de taille n.
Soit S la variable aléatoire donnant le nombre d’éléments de cet échantillon qui possèdent la
propriété considérée.

Pour constituer l’échantillon, on a une suite de n épreuves :


 Chaque épreuve consiste à tirer au hasard un élément de la population, à donner un
résultat dans l’alternative [« propriété réalisée », «propriété non réalisée »], on remet
alors cet élément dans la population.
 Dans n’importe la quelle des épreuves, p est la probabilité d’obtenir le résultat
« propriété réalisée » .
 Ces n épreuves se déroulent de façon indépendante.

A la fin de cette suite de n épreuves, S donne le nombre de fois que l’on a trouvé le résultat
« propriété réalisée ». De cette manière :
S suit la loi binomiale ℬ(n ; p) ; S a pour espérance np et écart type np(1  p) .

1
Soit F = S ; F est la variable aléatoire qui donne la proportion d’éléments de l’échantillon
n
qui possèdent la propriété considérée.

1 1 np(1  p) p(1  p)
Comme (np)= p et np(1  p)   ,
n n n2 n
1 p(1  p)
F a pour espérance (np)= p et pour écart type .
n n

∗∗ En fait pour n suffisamment grand,


p(1  p)
F suit approximativement la loi normale N (p ; ).
n

∗∗∗ Remarque
S et F sont 2 variables aléatoires discrètes :
S peut prendre pour valeur toute nombre k entier compris entre 0 et n, F peut prendre pour
k
valeur tout fraction où k est un entier compris ente 0 et n.
n
p(1  p)
Ainsi dans l’approximation de la loi de F par la loi normale N (p ; ), on peut être
n
amené à effectuer une correction de continuité.
5 Exemple

Dans une population on constate qu’il naît 52 % de garçons et 48 % de filles.


On suppose que la variable aléatoire F qui, à tout échantillon de taille n = 400 prélevé au
hasard et avec remise dans la population, associe le pourcentage de garçons dans cet
échantillon suit une loi normale N (p ; 
On se propose de prélever un échantillon aléatoire non exhaustif de 400 nouveau-nés.

1. Quelles valeurs prend-on pour p et  ?.


2. Quelle est la probabilité d’avoir dans un tel échantillon, un pourcentage de garçons compris
entre 50 % et 54 % ?
3. Quelle est la probabilité d’avoir, dans un tel échantillon, un pourcentage de filles inférieur à
45 % ?

Résolution

On transforme les pourcentages en nombres décimaux et on considère que F est la variable


aléatoire qui, à tout échantillon de taille n = 400 prélevé au hasard et avec remise dans la
population, associe la proportion de garçons dans cet échantillon.

1. F suit une loi normale N (p ;  .


On prend p= 0,52 (avec 1–p = 0,48) et
p(1  p) 0,52  0,48 0,13  0,03  16 4 13  3 4 1
=      39 ,
n 400 100 10 100  100 10 100
soit  = 0,004 39 .

Fp 1 250
T=  ( F  0,52)  ( F  0,52) suit la loi normale N (0 ;1).
 0,004 39 39

2. On fait intervenir des événements équivalents et leur probabilité :


P(0,5  F  0,54) = P( -0,02  F– 0,52  0,02) soit
250 250 250
P(0,5  F  0,54)= P( -0,02 ×  (F–0,52)  0,02× ) soit
39 39 39
5 5 5
P(0,5  F  0,54) = P( - T ) = 2  ) –1 .
39 39 39

5 5
On fait des approximations =0,80 et  )= 0,7881, alors P(0,5  F  0,54) = 0,58 .
39 39

3. L’événement étudié est (0,55 < F) et on a en faisant intervenir des événements équivalents
250 250
P(0,55 < F) = P (0,03 < F– 0,52) = P( 0,03× < ( F– 0,52)) soit
39 39
7,5 7,5
P(0,55 < F) = P (  T ) = 1–  ).
39 39
7,5 7,5
On fait des approximations =1,20 et  ) = 0,8849, alors P(0,55 < F) = 0,12 .
39 39