Vous êtes sur la page 1sur 23

Quelques

el
ements de la th
eorie de
l
echantillonnage

Jean-Jacques Daudin

AgroParisTech

2009

D
efinitions
Population : ensemble des unit
es sur lesquelles porte l
etude
Echantillon : sous-ensemble dunit
es de population
Base de sondage : liste des unit
es de la population
Taux de sondage : rapport entre la taille de l
echantillon et la
taille de la population

Echantillonnage al
eatoire simple

Notations
Y

: variable (ou caract`


ere)
etudi
ee

n : nombre dunit
es dans l
echantillon (taille de l
echantillon)
N : nombre dunit
es dans la population (taille de la population)
n
Taux de sondage : f = N
3

u : unit
e de population ( = 1, N )
ui : unit
e de l
echantillon (i = 1, n)
y : valeur de Y mesur
ee sur lunit
e u
n
1 X
=
Y
yi
n i=1
n
X
1
)2
S2 =
(yi Y
n 1 i=1
N
1 X
=
y
N =1

2 =

N
X
1
(y )2
N 1 =1
4

Echantillon al
eatoire simple

echantillon obtenu par une m


ethode qui assure `
a chaque
echantillon
possible la m
eme probabilit
e d
etre s
electionn
e.
n
CN
echantillons possibles (tirage sans remise)

La probabilit
e dobtenir lun quelconque dentre eux est
egale
`
a C1n .
N

Chaque unit
e a la m
eme probabilit
e dappartenir `
a l
echantillon
n
P (u echantillon) = N
5

Exemple
Population : a, b, c, d
N=4
Valeurs de Y : ya = 1 yb = 2 yc = 3 yd = 4
= 2.5
2 + 0.52 + 0.52 + 1.52 ) = 5
2 = 1
(1.5
3
3

Echantillonnage al
eatoire simple avec n=2
6
echantillons possibles :
(a,b) (a,c) (a,d) (b,c) (b,d) (c,d)
6

Propri
et
es
) =
1. E(Y
lesp
erance E est prise sur tous les
echantillons possibles (et

equiprobables)
2

) = (1 f )
2. V (Y
n
) est la variance des moyennes des
o`
u V (Y
echantillons possibles
1 f : facteur de correction pour population finie
On ne connait pas 2 : on lestime par S 2

) tend vers une loi normale centr


3. La loi de Zn = n(Y
ee
quand n tend vers linfini.
7

Exemple (suite)

echantillon
(a,b)
(a,c)
(a,d)
(b,c)
(b,d)
(c,d)

Y
1.5
2
2.5
2.5
3
3.5

erreur d
echantillonnage
-1
-0.5
0
0
0.5
1

Moyenne

2.5

Variance

5
12

2.5
6

) = = 2.5
E(Y
5

2
) = (1 f ) = 3 (1 1 ) = 5
V (Y
n
2
2
12
8

Estimation dune proportion


On veut connaitre la proportion des unit
es de la population qui
poss`
edent une caract
eristique
La variable
etudi
ee prend 2 valeurs : y=1 si lunit
e u poss`
ede
la caract
eristique et 0 sinon.
(resp. P ) : proportion dunit
es de la population (resp. de
l
echantillon) qui poss`
edent la caract
eristique
et S 2 = n P (1 P )
P =Y
n1
= et 2 = NN
1 (1 )
Les propri
et
es
enonc
ees pour lestimation dune moyenne restent vraies pour une proportion.
9

Echantillonnage stratifi
e
Partition de la population en H strates
Nh : taille de la strate h,
PH
h
N = h=1 Nh et Wh = N
N
Echantillonnage stratifi
e : on prend un
echantillon al
eatoire
simple dans chaque strate.
nh : taille de l
echantillon dans la strate h,
PH
nh
n = h=1 nh et fh = N
h
fh = f ,
echantillon stratifi
e proportionnel
10

h : moyenne de Y dans la strate h


h2 : variance de Y dans la strate h
h : moyenne de Y dans l
Y
echantillon issu de la strate h
echantillon issu de la strate h
Sh2 : variance de Y dans l
st =
Pour estimer on utilise Y

PH

h=1 Wh Yh

PH
h2
2
st) =

V (Y
h=1 Wh V (Yh ) et V (Yh ) = nh (1 fh )

A taille d
echantillon total
egale, Yst est plus pr
ecis que
.
Y
Il est dautant plus pr
ecis que les strates ont des moyennes
diff
erentes.
11

Exemple
Population : a, b, c, d N = 4
Valeurs de Y : ya = 1 yb = 2 yc = 3 yd = 4
2 strates : strate 1 : a, b ; strate 2 : c,d
N1 = N2 = 2, 12 = 22 = 0.5
W1 = W2 = 1
2 , = 2.5
Echantillon stratifi
e proportionnel : n1 = n2 = 1 et n =2
4
echantillons possibles : (a,c) (a,d) (b,c) (b,d)
12


echantillon
(a,c)
(a,d)
(b,c)
(b,d)
moyenne

Y
2
2.5
2.5
3
2.5

erreur d
echantillonnage
-0.5
0
0
0.5
0

variance

0.5
4

0.5
4

) = = 2.5
E(Y
22
12
2
2
st) = W1
(1 f1) + W2
(1 f2)
V (Y
n1
n2
st) =
V (Y

1
1
1
1
0.5
(0.5)(1 ) + (0.5)(1 ) =
4
2
4
2
4
st )
st )
V (Y
(Y
=
0.3
et
)
) = 0.58
V (Y
(Y
13

Echantillonnage `
a deux degr
es
Partition de la population en M unit
es primaires (UP)
Chaque UP est constitu
ee dunit
es de population : les unit
es
secondaires (US).
Echantillonnage `
a deux degr
es :
on pr
el`
eve selon un
echantillonnage al
eatoire simple m UP
parmi les M , puis on pr
eleve des US parmi les UP s
electionn
ees.

14

Ni : taille de lunit
e primaire i, N =

PM
Ni
N
,
W
=
i
i
i=1
N

ni : taille de l
echantillon dans lUP i, n =

Pm
i=1 ni

i : moyenne de Y dans l
Y
echantillon de U Pi
Pour estimer :
m
M X
i
2d =
Wi Y
Y
m i=1

2d est moins pr
A taille d
echantillon total
egale, Y
ecis que l
echantillonnage al
eatoire simple
(dautant moins que les moyennes des UP sont diff
erentes).
15

Exemple
Population : a, b, c, d , N=4, Valeurs de Y : ya = 1 yb = 2 yc = 3
yd = 4
2 UP : UP1 : a, b UP2 : c,d
N1 = N2 = 2
M=2 ; m=1 f1 = f2 = 1
On pr
el`
eve un
echantillon de 2 unit
es dans lune ou lautre des
deux unit
es primaires
2
echantillons possibles : (a,b) (c,d)

16


echantillon
(a,b)
(c,d)
moyenne
variance

Y
1.5
3.5
2.5
1

erreur d
echantillonnage
-1
1
0
1

) = = 2.5, V (Y
2d) = 1
E(Y
2d)
V (Y
= 2.4
)
V (Y
2d)
(Y
= 1.5
)
(Y

17

Sources derreurs dans une enqu


ete
Erreur d
echantillonnage : erreur due au fait que l
echantillon
est diff
erent de la population
Erreur de mesure : erreur due `
a lappareil de mesure (formulation des questions, biais de complaisance, incompr
ehension...
dans la cas dun questionnaire)
Erreur de couverture : erreur li
ee au fait que la population

echantillonn
ee nest pas celle que lon voulait
etudier
Non-r
eponses : absence de mesure pour certaines unit
es de
l
echantillon

18

Exemple derreur de mesure en sciences


humaines (1)
Pensez-vous que les Etats-Unis doivent autoriser les discours publics contre la d
emocratie ?
Doivent autoriser : 21%
Ne doivent pas autoriser : 62%
Pas dopinion : 17%
Pensez-vous que les Etats-Unis doivent interdire les discours publics contre la d
emocratie ?
Doivent interdire : 46%
Ne doivent pas interdire : 39%
Pas dopinion : 175%
19

Exemple (2)
Selon vous quels sont aujourdhui les deux probl`
emes les plus
graves dans la liste des items ci-dessous ?
La liste est propos
ee dans lordre pour une partie de l
echantillon et dans
lordre inverse pour lautre partie.

R
eponse
Chomage
Terrorisme
Faim dans le monde
Guerres
Racisme
Non respect des droits de lhomme
Formation des jeunes
D
elinquance

ordre direct
34%
8.5%
21%
15%
5%
8%
1%
1%

ordre inverse
19%
7%
17%
18%
8%
10%
6%
8%
20

Conseils pour
etablir un questionnaire
1. Les questions doivent
etre compr
ehensibles

eviter le vocabulaire technique

eviter les questions impr
ecises

eviter les doubles n
egations
2. Les personnes doivent pouvoir r
epondre
toutes les situations doivent
etre pr
evues

eviter de trop faire appel `
a la m
emoire (d
efaillante)
3. Les questions doivent appeler une r
eponse sinc`
ere et non
suscit
ee

eviter les questions contenant la r
eponse
biais de d
esirabilit
e sociale
attraction de la r
eponse positive
4. Eviter les questionnaires trop longs
21

Autres mots cl
es
M
ethode des quotas
Echantillonnage syt
ematique
M
ethodes de redressement ; stratification `
a post
eriori
Sondage avec probabilit
es in
egales
Panels

22

R
ef
erences
Les sondages : principes et m
ethodes A.M. Dussaix, J-M. Grosbras, Que sais-je ? (701). PUF
Sampling techniques W.G. Cochran, Wiley.
Pratique et analyse des enque tes par sondage M. Deroo, A.M.
Dussaix, PUF

23