Académique Documents
Professionnel Documents
Culture Documents
Introduction à
l’échantillonnage
Les sondages
Notions fondamentales
Fluctuations d’échantillonnage d’une moyenne
Théorème central limite
C6-1
Étude de marché / sondage /
échantillonnage
Les sondages / échantillonnage visent à découvrir des renseignements
au sujet d’une population particulière
Une étude de marché / sondage / échantillonnage consiste à prélever
un sous-ensemble d’unités statistiques d’une population afin de mieux
en connaître les caractéristiques (préférences, revenus, intention
d’achat, …)
Moins dispendieux qu’un recensement qui considère toutes les unités
statistiques de la population
Bien que plus précis, les recensements sont plus dispendieux et
prennent en général plus de temps
Pour obtenir des renseignements valides, il faut prélever selon des
méthodes appropriées un échantillon représentatif de la population
C6-2
Population Échantillons
e1 e4 e2 e1
e8 e12
e12 n
s1 x1
e21 e22
e5 e21
e108 L’échantillonnage e102
e323 vise à mieux
connaître un
paramètre d’une
s2 x2 n
population à partir
d’une statistique
E(X) X
2(X) S2(X)
C6-3
f(X) P(X=x)
Fluctuations d’échantillonnage
d’une moyenne
Il est facile de constater que si nous prélevons tous les
échantillons possibles de même taille n d’une population de taille
N, la moyenne arithmétique calculée sur chaque échantillon peut
varier d’un échantillon à l’autre
Il y a donc des fluctuations de la moyenne arithmétique des
échantillons autour de la moyenne de la population
C6-4
Distribution d'échantillonnage
La distribution de probabilité d'une statistique s’appelle la
distribution d’échantillonnage puisque les variations sont
attribuables à l’échantillonnage
Par exemple, la distribution d'échantillonnage de la moyenne X
C6-5
Espérance mathématique
de la distribution de X
Soit une variable statistique X qui suit une loi de probabilité de
moyenne E(X) = et de variance Var(X) = 2
Si on prélève un échantillon aléatoire de taille n d’une
population infinie (ou d’une population finie et un
échantillonnage avec remise), alors la moyenne d’échantillon X
suit une loi de probabilité d’espérance mathématique
E( X ) = E( X ) =
C6-6
Variance de la distribution de X
La variance de est: X
2
Var( X ) = 2 ( X ) = X2 =
n
• L’écart-type de la moyenne d’échantillon, aussi appelé
l’erreur type de la moyenne, est:
( X ) = X =
n
C6-7
Théorème central limite
La distribution d’échantillonnage de la variable aléatoire X
tend à se rapprocher d’une loi normale d’autant plus que la
taille de l’échantillon est grande
( X )=
n
E( X )= X
C6-8
Exemple 1: distribution d’échantillonnage
Entreprises Âge d'informatisation (années), X
A 8
B 8,5
C 9
D 9,5
E 10
On a une population formée de cinq unités statistiques: x1=8,
x2=8,5, x3=9, x4=9,5, x5=10
= E( X ) = x
=
i 45
= 9 ans
N 5
= Var( X ) =
2 i
( x − ) 2
=
2 ,5
= 0 ,5
C6-9 N 5
Exemple 1: distribution de X
Distribution de la population
Fréquence relative
0,2
0,15
0,1
0,05
0
8 8,5 9 9,5 10
Âge (années)
E( X ) = 9 Var( X ) = 0 ,5
C6-10
Exemple 1: estimation de
Afin d’estimer , on prélève avec remise un échantillon aléatoire
de taille n=2
On peut donc former 5×5 = 25 échantillons différents
On calcule pour chaque échantillon, la moyenne et on construit
ensuite l’histogramme de ces 25 moyennes, la distribution
d’échantillonnage de X
C6-11
Exemple 1: les échantillons et leur moyenne
Échantillons Entreprises Résultats Moyenne
1 (A,A) (8, 8) 8
2 (A,B) (8, 8,5) 8,25
3 (A,C) (8, 9) 8,5
4 (A,D) (8, 9,5) 8,75
5 (A,E) (8, 10) 9
6 (B,A) (8,5, 8) 8,25
7 (B,B) (8,5, 8,5) 8,5
8 (B,C) (8,5, 9) 8,75
9 (B,D) (8,5, 9,5) 9
10 (B,E) (8,5, 10) 9,25
11 (C,A) (9, 8) 8,5
12 (C,B) (9, 8,5) 8,75
13 (C,C) (9, 9) 9
14 (C,D) (9, 9,5) 9,25
15 (C,E) (9, 10) 9,5
16 (D,A) (9,5, 8) 8,75
17 (D,B) (9,5, 8,5) 9
18 (D,C) (9,5, 9) 9,25
19 (D,D) (9,5, 9,5) 9,5
20 (D,E) (9,5, 10) 9,75
21 (E,A) (10, 8) 9
22 (E,B) (10, 8,5) 9,25
23 (E,C) (10, 9) 9.5
C6-12 24 (E,D) (10, 9,5) 9,75
25 (E,E) (10, 10) 10
Exemple 1: distribution de fréquence de X
C6-13
Exemple 1: distribution d’échantillonnage
de la moyenne
0,25
Fréquence relative
0,20
0,15
0,10
0,05
0,00
8,00 8,25 8,50 8,75 9,00 9,25 9,50 9,75 10,00
Âge (années)
C6-14
Exemple 1: forme de la distribution
d’échantillonnage
On observe que la forme de la distribution d’échantillonnage
tend vers la loi normale
0,25
Fréquence relative
0,20
0,15
0,10
0,05
0,00
8,00 8,25 8,50 8,75 9,00 9,25 9,50 9,75 10,00
Âge (années)
C6-15
Exemple 1: moyenne de la distribution
d’échantillonnage
Moyennes Fréquence Moyenne × Fréquence
8,00 1 8,00
8,25 2 16,50
8,50 3 25,50
8,75 4 35,00
9,00 5 45,00
9,25 4 37,00
9,50 3 28,50
9,75 2 19,50
10,00 1 10,00
225,00
E (X ) = = 9 = E(X ) =
225
25
C6-16
Exemple 1: variance de la distribution
d’échantillonnage
X Fréquence X − E(X) (X − E ( X ) )
2
(X − E( X)) 2
f
8,00 1 -1,00 1,00 1,00
8,25 2 -0,75 0,56 1,13
8,50 3 -0,50 0,25 0,75
8,75 4 -0,25 0,06 0,25
9,00 5 0,00 0,00 0,00
9,25 4 0,25 0,06 0,25
9,50 3 0,50 0,25 0,75
9,75 2 0,75 0,56 1,13
10,00 1 1,00 1,00 1,00
6,25
6 ,25 0 ,5 2
Var( X ) = = = 0 ,25 =
25 2 n
C6-17
Transformation de X en une variable aléatoire
centrée réduite
a− b−
P( a X b ) = P( Z )
n n
N(/n) N()
a b X z1 0 z2 Z
a−
z1 =
n b−
z2 =
C6-18 n
Exemple 2: distribution d’échantillonnage
Les résultats d’un test d’aptitude sont distribués
selon une loi normale de moyenne = 150 et
de variance 2 = 100
On fait passer le test à un échantillon aléatoire
de 25 individus
Déterminer les caractéristiques de la distribution
d’échantillonnage X
C6-19
Exemple 2: forme de la distribution
d’échantillonnage
10
( X )= = =2
n 25
E( X )= = 150 X
C6-20
Exemple 2: calcul des probabilités
Quelle est la probabilité que la moyenne
d’échantillon soit comprise entre 146 et 154?
E( X ) =
Var( X ) 2
Var( X ) = =
n n
C6-22
Distribution de X
quelque soit n
C6-23
Distribution de X
Cas 2: Les observations proviennent d’une
population de distribution et de variance inconnues
mais n grand, alors on a approximativement
X N( , S 2 n )
C6-24
Exemple 3: distribution d’échantillonnage
C6-27