el
ements de la th
eorie de
l
echantillonnage
Jean-Jacques Daudin
AgroParisTech
2009
D
efinitions
Population : ensemble des unit
es sur lesquelles porte l
etude
Echantillon : sous-ensemble dunit
es de population
Base de sondage : liste des unit
es de la population
Taux de sondage : rapport entre la taille de l
echantillon et la
taille de la population
Echantillonnage al
eatoire simple
Notations
Y
n : nombre dunit
es dans l
echantillon (taille de l
echantillon)
N : nombre dunit
es dans la population (taille de la population)
n
Taux de sondage : f = N
3
u : unit
e de population ( = 1, N )
ui : unit
e de l
echantillon (i = 1, n)
y : valeur de Y mesur
ee sur lunit
e u
n
1 X
=
Y
yi
n i=1
n
X
1
)2
S2 =
(yi Y
n 1 i=1
N
1 X
=
y
N =1
2 =
N
X
1
(y )2
N 1 =1
4
Echantillon al
eatoire simple
La probabilit
e dobtenir lun quelconque dentre eux est
egale
`
a C1n .
N
Chaque unit
e a la m
eme probabilit
e dappartenir `
a l
echantillon
n
P (u echantillon) = N
5
Exemple
Population : a, b, c, d
N=4
Valeurs de Y : ya = 1 yb = 2 yc = 3 yd = 4
= 2.5
2 + 0.52 + 0.52 + 1.52 ) = 5
2 = 1
(1.5
3
3
Echantillonnage al
eatoire simple avec n=2
6
echantillons possibles :
(a,b) (a,c) (a,d) (b,c) (b,d) (c,d)
6
Propri
et
es
) =
1. E(Y
lesp
erance E est prise sur tous les
echantillons possibles (et
equiprobables)
2
) = (1 f )
2. V (Y
n
) est la variance des moyennes des
o`
u V (Y
echantillons possibles
1 f : facteur de correction pour population finie
On ne connait pas 2 : on lestime par S 2
Exemple (suite)
echantillon
(a,b)
(a,c)
(a,d)
(b,c)
(b,d)
(c,d)
Y
1.5
2
2.5
2.5
3
3.5
erreur d
echantillonnage
-1
-0.5
0
0
0.5
1
Moyenne
2.5
Variance
5
12
2.5
6
) = = 2.5
E(Y
5
2
) = (1 f ) = 3 (1 1 ) = 5
V (Y
n
2
2
12
8
Echantillonnage stratifi
e
Partition de la population en H strates
Nh : taille de la strate h,
PH
h
N = h=1 Nh et Wh = N
N
Echantillonnage stratifi
e : on prend un
echantillon al
eatoire
simple dans chaque strate.
nh : taille de l
echantillon dans la strate h,
PH
nh
n = h=1 nh et fh = N
h
fh = f ,
echantillon stratifi
e proportionnel
10
PH
h=1 Wh Yh
PH
h2
2
st) =
V (Y
h=1 Wh V (Yh ) et V (Yh ) = nh (1 fh )
A taille d
echantillon total
egale, Yst est plus pr
ecis que
.
Y
Il est dautant plus pr
ecis que les strates ont des moyennes
diff
erentes.
11
Exemple
Population : a, b, c, d N = 4
Valeurs de Y : ya = 1 yb = 2 yc = 3 yd = 4
2 strates : strate 1 : a, b ; strate 2 : c,d
N1 = N2 = 2, 12 = 22 = 0.5
W1 = W2 = 1
2 , = 2.5
Echantillon stratifi
e proportionnel : n1 = n2 = 1 et n =2
4
echantillons possibles : (a,c) (a,d) (b,c) (b,d)
12
echantillon
(a,c)
(a,d)
(b,c)
(b,d)
moyenne
Y
2
2.5
2.5
3
2.5
erreur d
echantillonnage
-0.5
0
0
0.5
0
variance
0.5
4
0.5
4
) = = 2.5
E(Y
22
12
2
2
st) = W1
(1 f1) + W2
(1 f2)
V (Y
n1
n2
st) =
V (Y
1
1
1
1
0.5
(0.5)(1 ) + (0.5)(1 ) =
4
2
4
2
4
st )
st )
V (Y
(Y
=
0.3
et
)
) = 0.58
V (Y
(Y
13
Echantillonnage `
a deux degr
es
Partition de la population en M unit
es primaires (UP)
Chaque UP est constitu
ee dunit
es de population : les unit
es
secondaires (US).
Echantillonnage `
a deux degr
es :
on pr
el`
eve selon un
echantillonnage al
eatoire simple m UP
parmi les M , puis on pr
eleve des US parmi les UP s
electionn
ees.
14
Ni : taille de lunit
e primaire i, N =
PM
Ni
N
,
W
=
i
i
i=1
N
ni : taille de l
echantillon dans lUP i, n =
Pm
i=1 ni
i : moyenne de Y dans l
Y
echantillon de U Pi
Pour estimer :
m
M X
i
2d =
Wi Y
Y
m i=1
2d est moins pr
A taille d
echantillon total
egale, Y
ecis que l
echantillonnage al
eatoire simple
(dautant moins que les moyennes des UP sont diff
erentes).
15
Exemple
Population : a, b, c, d , N=4, Valeurs de Y : ya = 1 yb = 2 yc = 3
yd = 4
2 UP : UP1 : a, b UP2 : c,d
N1 = N2 = 2
M=2 ; m=1 f1 = f2 = 1
On pr
el`
eve un
echantillon de 2 unit
es dans lune ou lautre des
deux unit
es primaires
2
echantillons possibles : (a,b) (c,d)
16
echantillon
(a,b)
(c,d)
moyenne
variance
Y
1.5
3.5
2.5
1
erreur d
echantillonnage
-1
1
0
1
) = = 2.5, V (Y
2d) = 1
E(Y
2d)
V (Y
= 2.4
)
V (Y
2d)
(Y
= 1.5
)
(Y
17
echantillonn
ee nest pas celle que lon voulait
etudier
Non-r
eponses : absence de mesure pour certaines unit
es de
l
echantillon
18
Exemple (2)
Selon vous quels sont aujourdhui les deux probl`
emes les plus
graves dans la liste des items ci-dessous ?
La liste est propos
ee dans lordre pour une partie de l
echantillon et dans
lordre inverse pour lautre partie.
R
eponse
Chomage
Terrorisme
Faim dans le monde
Guerres
Racisme
Non respect des droits de lhomme
Formation des jeunes
D
elinquance
ordre direct
34%
8.5%
21%
15%
5%
8%
1%
1%
ordre inverse
19%
7%
17%
18%
8%
10%
6%
8%
20
Conseils pour
etablir un questionnaire
1. Les questions doivent
etre compr
ehensibles
eviter le vocabulaire technique
eviter les questions impr
ecises
eviter les doubles n
egations
2. Les personnes doivent pouvoir r
epondre
toutes les situations doivent
etre pr
evues
eviter de trop faire appel `
a la m
emoire (d
efaillante)
3. Les questions doivent appeler une r
eponse sinc`
ere et non
suscit
ee
eviter les questions contenant la r
eponse
biais de d
esirabilit
e sociale
attraction de la r
eponse positive
4. Eviter les questionnaires trop longs
21
Autres mots cl
es
M
ethode des quotas
Echantillonnage syt
ematique
M
ethodes de redressement ; stratification `
a post
eriori
Sondage avec probabilit
es in
egales
Panels
22
R
ef
erences
Les sondages : principes et m
ethodes A.M. Dussaix, J-M. Grosbras, Que sais-je ? (701). PUF
Sampling techniques W.G. Cochran, Wiley.
Pratique et analyse des enque tes par sondage M. Deroo, A.M.
Dussaix, PUF
23