Echantillonnage et Redressement
Guillaume Chauvet
cole Nationale de la Statistique et de lAnalyse de lInformation
27 avril 2015
Echantillonnage
27 avril 2015
1 / 198
Panorama du cours
Mthodes dchantillonnage
Mthodes de redressement
Echantillonnage
27 avril 2015
2 / 198
Objectifs du cours
Echantillonnage
27 avril 2015
3 / 198
Echantillonnage
27 avril 2015
4 / 198
Notations
Notations
Echantillonnage
27 avril 2015
5 / 198
Notations
Notations
On se place dans le cadre dune population finie U dindividus ou units
statistiques, supposes identifiables par un label. On notera simplement
U = {1, . . . , k, . . . , N }
o N dsigne la taille de la population U .
On sintresse une variable dintrt y (ventuellement vectorielle), qui
prend la valeur yk sur lindividu k de U . La variable y est vue ici comme non
alatoire : la population U tant fixe, la valeur prise par y sur chaque
individu est parfaitement dfinie et dterministe.
On souhaite disposer dindicateurs pour la population U (totaux, moyennes,
fractiles, indices, ...).
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
6 / 198
Notations
Notations
Echantillonnage
27 avril 2015
8 / 198
Notations
Exemples
Exemple 1 : Les enqutes-mnages de lInsee visent dcrire les conditions de vie des mnages (emploi, logement, patrimoine, ... ). Les mnages
enquts sont slectionns dans un chantillon de zones appel lEchantillonMatre.
Exemple 2 : Les enqutes-entreprises sont ralises laide dune base de
sondage (rpertoire SIRENE) et de sources externes.
Exemple 3 : Enqute auprs dun chantillon de personnes pour connatre
une opinion politique, les habitudes en termes de media, lavis sur un produit ... On utilise souvent dans ce cas des mthodes de tirage empiriques
(chantillonnage par quotas, chantillonnage de volontaires).
Echantillonnage
27 avril 2015
9 / 198
Notations
Paramtre dintrt
(y
,
o S dsigne lchantillon alatoire finalement observ.
Echantillonnage
27 avril 2015
10 / 198
Notations
Paramtre dintrt
Total et moyenne
yk
kU
1 X
yk .
N
kU
Exemple :
Chiffre daffaires total des entreprises dun secteur dactivit, pourcentage
dtudiants fumeurs, ...
Echantillonnage
27 avril 2015
11 / 198
Notations
Paramtre dintrt
Estimation sur domaine
ou dune moyenne
yd =
1 X
yk
Nd
kUd
Echantillonnage
27 avril 2015
12 / 198
Ud
Notations
Paramtre dintrt
Estimation par substitution
ty
tx
estim par
Echantillonnage
= ty .
R
tx
27 avril 2015
14 / 198
Notations
Paramtre dintrt
Estimation par substitution
Exemple 2 :
OR =
pA
1pA
pB
1pB
estim par
d=
OR
pA
1
pA
pB
1
pB
Il est galement possible destimer des paramtres plus complexes tels que
des fractiles (mdianes), ou des indices (Gini, utilis comme indicateur dingalit).
Echantillonnage
27 avril 2015
15 / 198
Notations
Plan de sondage
La slection de lchantillon alatoire S se fait laide dun plan de sondage
p sur U , cest dire laide dune loi de probabilit sur les parties de U :
X
s U p(s) 0 et
p(s) = 1.
sU
lestimateur (y
k , k s) (s).
lestimation (y
On appelle algorithme dchantillonnage une mthode pratique permettant
de slectionner un chantillon selon le plan de sondage choisi.
Echantillonnage
27 avril 2015
16 / 198
Notations
Exemple
Soit la population U = {1, 2, 3, 4}, et p() le plan de sondage dfini par :
p({1, 2})
= 0.2
p({1, 2, 3}) = 0.3
p({1, 4})
= 0.1
p({2, 3, 4}) = 0.1
Echantillonnage
27 avril 2015
17 / 198
Notations
k
.
k!
= .
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
18 / 198
Notations
Mesures de prcision
(s)
=
Ep (S)
sU
p(s) (s).
sU
Bp (S)
= Ep (S)
h
i
X
.
=
p(s) (s)
sU
Echantillonnage
27 avril 2015
19 / 198
Notations
Mesures de prcision
On sintressera galement la Variance
n
i
h
o2
n
o2
Ep [(S)]
,
p(s) (s)
sU
EQMp (S)
= Ep (S)
h
i2
h
i
= Bp (S)
+ Vp (S)
.
Echantillonnage
27 avril 2015
20 / 198
Notations
Quelques simulations
Echantillonnage
27 avril 2015
21 / 198
200
170
180
190
200
170
180
190
200
190
50
60
70
80
90
100
50
60
70
taille
160
150
80
90
100
50
90
100
50
60
70
200
180
180
190
200
poids
170
taille
170
130
140
150
160
taille
100
100
180
170
100
160
90
90
taille
90
150
80
80
200
80
140
poids
100
150
70
130
70
90
140
60
190
200
190
180
170
taille
160
150
140
60
80
poids
130
50
100
130
50
poids
90
160
taille
150
140
130
80
80
190
200
170
180
160
taille
160
150
140
130
70
70
poids
190
190
170
180
60
60
poids
200
poids
50
130
130
140
150
160
taille
140
180
170
130
140
150
160
taille
50
60
70
poids
80
90
100
50
60
70
poids
Notations
Echantillonnage
27 avril 2015
23 / 198
Notations
On note kl la probabilit que deux units distinctes k et l soient slectionnes conjointement dans lchantillon :
X
kl = P(k, l S) =
p(s)
s/k,ls
Ces probabilits doubles interviennent notamment dans la variance des estimateurs. Il est souvent difficile de les calculer exactement, sauf pour des
plans de sondage particuliers.
Echantillonnage
27 avril 2015
24 / 198
Notations
Application
Soit la population U = {1, 2, 3, 4}, et p() le plan de sondage dfini par :
p({1, 2})
= 0.2
p({1, 2, 3}) = 0.3
p({1, 4})
= 0.1
p({2, 3, 4}) = 0.1
Echantillonnage
27 avril 2015
25 / 198
Notations
Variables indicatrices
Lutilisation de la variable Ik = 1(k S), indiquant lappartenance lchantillon de lunit k, permet souvent de simplifier les calculs.
Pour deux units k et l distinctes, on a notamment les proprits suivantes :
Ep (Ik ) = k ,
Vp (Ik ) = k (1 k ),
Covp (Ik , Il ) = kl k l
kl .
Echantillonnage
27 avril 2015
26 / 198
Notations
En rsum
Un plan de sondage est une loi de probabilit sur les parties de U . Lalea
porte sur le sous-ensemble S dindividus observs.
=
p(s) (s)
Bp (S)
sU
Vp (S)
n
o2
Ep [(S)]
p(s) (s)
.
sU
Echantillonnage
27 avril 2015
27 / 198
Estimation de Horvitz-Thompson
Estimation de Horvitz-Thompson
Echantillonnage
27 avril 2015
28 / 198
Estimation de Horvitz-Thompson
Objectif
1 X
yk .
N
kU
Echantillonnage
27 avril 2015
29 / 198
Estimation de Horvitz-Thompson
La -estimation
La connaissance des probabilits k permet une estimation sans biais dun
total sous le plan de sondage, i.e. sous le mcanisme alatoire associ au
plan de sondage. Le total ty est estim sans biais par
ty =
X yk
X yk
=
Ik
k
k
kS
(1)
kU
Echantillonnage
27 avril 2015
30 / 198
Estimation de Horvitz-Thompson
Biais de couverture
Si certaines probabilits dinclusion sont nulles, le -estimateur est biais :
X
E ty =
yk
kU
k >0
= ty
yk .
kU
k =0
Echantillonnage
27 avril 2015
31 / 198
Estimation de Horvitz-Thompson
Echantillonnage
27 avril 2015
32 / 198
Estimation de Horvitz-Thompson
Variance
La variance du -estimateur est donne par
X yk yl
Vp ty =
kl .
k l
(2)
k,lU
(3)
k,lS
Echantillonnage
27 avril 2015
33 / 198
Estimation de Horvitz-Thompson
Dfinitions
Dfinition
Un plan de sondage p() est dit de taille fixe, gale n, si seuls les chantillons de taille n ont une probabilit non nulle dtre tirs :
Card(s) 6= n p(s) = 0.
Dfinition
Un plan de sondage p() est dit simple si deux chantillons de mme taille
ont la mme probabilit dtre slectionns :
Card(s1 ) = Card(s2 ) p(s1 ) = p(s2 ).
Echantillonnage
27 avril 2015
34 / 198
Estimation de Horvitz-Thompson
Exemples
Soit la population U = {1, 2, 3, 4}.
Exemple 1 :
p({1, 2})
= 0.2
p({1, 2, 3}) = 0.3
p({1, 4})
= 0.1
p({2, 3, 4}) = 0.1
p({3, 4})
= 0.3
Exemple 2 :
p({1, 2})
= 1/3
p({1, 4})
p({3, 4})
= 1/3
Exemple 3 :
p({1, 2, 3}) = 1/4
= 1/3
Echantillonnage
27 avril 2015
35 / 198
Estimation de Horvitz-Thompson
Variance
Pour un plan de taille fixe, la variance du -estimateur peut se rcrire sous
la forme
1 X yk
yl 2
Vp ty =
kl .
(4)
2
k
l
k6=lU
2
k
l
kl
(5)
k6=lS
Echantillonnage
27 avril 2015
36 / 198
Estimation de Horvitz-Thompson
1 X
yk
yl 2
vY G ty = Vp ty
k l
.
2 k,lU
k
l
kl =0
Si y est valeurs positives, les deux estimateurs de variance sont respectivement biaiss positivement et ngativement.
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
37 / 198
Estimation de Horvitz-Thompson
Echantillonnage
27 avril 2015
38 / 198
Estimation de Horvitz-Thompson
Si n dsigne la taille dchantillon souhaite, les probabilits dinclusion proportionnelles une variable auxiliaire positive x sont donnes par
k = n P
xk
lU
xl
Echantillonnage
27 avril 2015
39 / 198
Estimation de Horvitz-Thompson
1
200
2
80
3
50
4
50
5
10
6
10
Echantillonnage
27 avril 2015
40 / 198
Calcul de prcision
Intervalle de confiance
Echantillonnage
27 avril 2015
41 / 198
Calcul de prcision
Intervalle de confiance
On suppose que ty estime sans biais ty . Alors un intervalle de confiance
pour ty de niveau approximatif 1 est donn par :
q
IC1 [ty ] = ty z1 2 Vp ty ,
avec z1 2 le quantile dordre 1 2 dune loi normale centre rduite N (0, 1).
Rappel :
= 0.05 z0.975 = 1.96
= 0.10 z0.95 = 1.64
Interprtation (pour = 0.05) : le vrai total ty est contenu dans lintervalle
de confiance pour (approximativement) 95% des chantillons.
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
42 / 198
Calcul de prcision
Intervalle de confiance
Comme la vraie variance Vp ty est gnralement inconnue, on la remplace
par un estimateur not v ty .
On obtient lintervalle de confiance estim :
q
c
IC 1 [ty ] = ty z1 2 v ty .
Lintervalle de confiance est (approximativement) valide :
si lestimateur ty suit approximativement une loi N ty , Vp ty ,
si lestimateur de variance v ty est faiblement consistant.
Echantillonnage
27 avril 2015
43 / 198
Calcul de prcision
Coefficient de variation
La prcision de lestimation du total peut galement tre donne sous la
forme du coefficient de variation
q
q
V
t
v ty
p y
ty =
estim par CV
CV p ty =
.
ty
ty
Il sagit dune grandeur sans dimension, plus facile comparer et interprter
que la variance. Avec un niveau de confiance de 0.95, lintervalle de confiance
du total est donn par
q
c
IC 0.95 [ty ] = ty 1.96 v ty
h
i
ty .
= ty 1 1.96 CV
Interprtation : un CV de x% correspond un total connu plus ou moins
2 x% , avec un niveau de confiance de 0.95.
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
44 / 198
Calcul de prcision
En rsum
La connaissance des probabilits dinclusion dordre 1 permet de calculer
lestimateur de Horvitz-Thompson du total
X yk
ty =
.
k
kS
Pour un plan de sondage quelconque, sa variance est estime sans biais par
X yk yl kl
vHT ty =
k l kl
k,lS
ty z1 2 v ty
o v(ty )
vY G (ty ) pds de taille fixe.
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
45 / 198
Echantillonnage
27 avril 2015
46 / 198
'
(6)
Echantillonnage
27 avril 2015
47 / 198
Technique de linarisation
f 0 (ty )
T
[yk ]
Echantillonnage
27 avril 2015
48 / 198
Estimation de variance
Pour un plan de sondage quelconque, on obtient :
h i
Vp ' Vp tu
X uk ul
=
kl .
k l
k,lU
Echantillonnage
27 avril 2015
49 / 198
ty
tx ,
=
estim par substitution par R
ty
.
tx
tx
Calcul de variance :
h i
Vp '
X uk ul
kl ,
k l
k,lU
h i
v =
X u
k u
l kl
.
k l kl
k,lS
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
50 / 198
Exemple
Population U de taille 10, dans laquelle un chantillon de taille n = 4 est
slectionn selon un SRS. Estimation des totaux tx et ty .
k
1
2
3
4
x
s2x
xk
5
1
4
8
= 4.5
= 8.3
tx = N x
= 45
ty = N y = 40
y
s2y
yk
1
3
2
10
= 4
= 16.7
2
v tx = N 2 1f
n sx = 125
1f
v ty = N 2 n s2y = 250
Echantillonnage
27 avril 2015
51 / 198
Exemple
Population U de taille 10, dans laquelle un chantillon de taille n = 4 est
slectionn selon un SRS. Estimation du ratio ty /tx .
k
1
2
3
4
x
s2x
xk
5
1
4
8
= 4.5
= 8.3
tx = N x
= 45
ty = N y = 40
= y
R
= 0.89
x
y
s2y
yk
1
3
2
10
= 4
= 16.7
u
k =
s2u
k)
Rx
-0.08
0.05
-0.03
0.06
= 0
= 4.4 103
1
(y
tx k
2
v tx = N 2 1f
n sx = 125
1f
v htyi = N 2 n s2y = 250
= N 2 1f s2 = 0.07
v R
n u
Echantillonnage
27 avril 2015
52 / 198
Mthodes dchantillonnage
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
53 / 198
Mthodes dchantillonnage
Tirage de Bernoulli
Le tirage de Bernoulli
Echantillonnage
27 avril 2015
54 / 198
Mthodes dchantillonnage
Tirage de Bernoulli
Principe
On se donne une mme probabilit dinclusion k pour chaque unit de
la population. Le choix se fait indpendamment dune unit lautre :
Etape 1 : on gnre u1 U [0, 1]. Si u1 , lunit 1 est retenue dans
lchantillon.
Etape 2 : on gnre u2 U [0, 1] indpendamment de u1 . Si u2 ,
lunit 2 est retenue dans lchantillon.
...
Etape N : on gnre uN U [0, 1] indpendamment de u1 , . . . , uN 1 .
Si uN , lunit N est retenue dans lchantillon.
Cest un principe de piles ou faces indpendants, avec une mme pice mais
un lancer diffrent pour chaque unit.
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
55 / 198
Mthodes dchantillonnage
Tirage de Bernoulli
Estimateur de Horvitz-Thompson
En utilisant les proprits dune loi U ([0, 1]), on a :
P(k S) = P(uk ) = FU () = .
Les probabilits dinclusion souhaites sont donc bien respectes, et le total
ty est estim sans biais par
ty =
1X
yk .
kS
Vp
kl = 2 pour k 6= l,
1 X 2
ty =
yk .
kU
Dautre part, la taille dchantillon n(S) est alatoire et suit une loi B(N, ).
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
56 / 198
Mthodes dchantillonnage
Tirage de Bernoulli
Application
Dans la population ci-dessous, utiliser les nombres alatoires pour slectionner un chantillon selon un tirage de Bernoulli, et en dduire une estimation
de ty .
Unit
k
uk
yk
Tirage
1
0.25
0.07
0
2
0.25
0.44
0
3
0.25
0.52
1
4
0.25
0.19
2
5
0.25
0.95
2
6
0.25
0.24
2
7
0.25
0.54
2
8
0.25
0.07
4
Echantillonnage
27 avril 2015
57 / 198
y =
X
ty
1
=
yk ,
N
E[n(S)]
kS
y =
ty
1 X
=
yk .
n(S)
N
kS
On peut montrer que ces deux estimateurs sont non biaiss pour ty , mais que
lestimateur par substitution
y est gnralement prfrable en termes de
variance :
1
1
1 X 2
Vp (
yk ,
y ) =
n N
N
kU
1
1
1 X
Vp (
y ) '
(yk y )2 .
n N
N
kU
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
59 / 198
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
60 / 198
Mthodes dchantillonnage
Estimateur de Horvitz-Thompson
Proposition
Soient k et l deux units distinctes quelconques. Alors :
k =
n
,
N
kl =
n(n 1)
.
N (N 1)
NX
yk
n
kS
= N y.
Echantillonnage
27 avril 2015
61 / 198
Mthodes dchantillonnage
Variance du -estimateur
avec
Sy2 =
1 X
(yk y )2 .
N 1
kU
avec
s2y =
1 X
(yk y)2 .
n1
kS
Echantillonnage
27 avril 2015
62 / 198
Mthodes dchantillonnage
1X
yk .
n
kS
1f 2
Sy .
n
(7)
Remarques :
Le facteur (1f ) donne le gain de variance d au tirage sans remise. On
lappelle correction de population finie. Ce gain peut tre trs important
(cas des enqutes-entreprise).
Si le taux de sondage est faible, la variance ne dpend que de la taille
dchantillon n.
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
63 / 198
Mthodes dchantillonnage
A retenir
Dans une enqute avec un faible taux de sondage, la variance est (approximativement) inversement proportionnelle la taille dchantillon.
Echantillonnage
27 avril 2015
64 / 198
Mthodes dchantillonnage
1 X
yk ,
N
kU
Echantillonnage
27 avril 2015
65 / 198
Mthodes dchantillonnage
Proposition
Dans le cas dune variable indicatrice (0/1) y, on a :
N
P (1 P ),
N 1
n
P (1 P ).
n1
Sy2 =
s2y =
1f N
P (1 P ),
n N 1
1f
P (1 P ).
n1
Echantillonnage
27 avril 2015
66 / 198
Mthodes dchantillonnage
P connu 8 % prs | P P
P | 0.08.
Echantillonnage
27 avril 2015
67 / 198
Mthodes dchantillonnage
P (1 P )
1.96
n N N 1
1
n
.
h
i2
1
N 1
1
+
N
N
1.96
P (1P )
On peut toujours se placer dans le pire des cas en prenant P = 0.5, mais il
est prfrable de disposer dun a priori (mme vague) sur le paramtre P .
Echantillonnage
27 avril 2015
68 / 198
Mthodes dchantillonnage
n N N 1 P
1
n
.
2 P
1
N 1
+
N
N
1.96
1P
Calculer cette borne ncessite de disposer dun a priori sur le paramtre P ,
ou au moins dun majorant pour ce paramtre.
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
69 / 198
Mthodes dchantillonnage
Application
Parmi les 350 tudiants de lEnsai, on veut estimer la proportion qui portent
des lunettes. Quelle taille dchantillon faut-il slectionner pour que cette
proportion soit estime 10% prs, avec un niveau de confiance de 0.95 :
1
Echantillonnage
27 avril 2015
70 / 198
Mthodes dchantillonnage
Algorithmes de slection
Algorithme 1 Mthode de slection draw by draw
1 Pour k = 1, . . . , n, slectionner une unit dans U probabilits gales
parmi les units qui nont pas dj t tires.
Inconvnient : mthode lente, qui ncessite n lectures de fichier.
Algorithme 2 Mthode du tri alatoire
1 On attribue un nombre alatoire u U [0, 1] chaque unit k U .
k
2
Echantillonnage
27 avril 2015
71 / 198
Algorithmes de slection
Algorithme 3 Mthode de slection-rejet
1 On initialise j = 0.
2 Pour k = 1, . . . , N , faire :
Avec une probabilit
nj
, on slectionne lunit k et j = j + 1.
N (k 1)
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
73 / 198
Mthodes dchantillonnage
Information auxiliaire
On parle dinformation auxiliaire lorsquune information est connue sur lensemble de la population, sous forme dtaille ou synthtique.
Il est frquent de disposer dune information auxiliaire sur la population, qui
va permettre de partitionner la population et dobtenir un plan de sondage
plus efficace que le SRS.
Exemples dinformation auxiliaire :
le sexe et lge, pour une enqute auprs dindividus physiques,
la taille (nombre demploys) pour les enqutes-entreprise.
Echantillonnage
27 avril 2015
74 / 198
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
75 / 198
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
76 / 198
Mthodes dchantillonnage
Dfinition
La population U est dite stratifie quand les units peuvent tre partitionnes en H sous-populations disjointes U1 , . . . , UH appeles strates.
Le plan de sondage est dit stratifi quand des chantillons indpendants
sont slectionns dans chaque strate.
On parle de Sondage alatoire simple stratifi (STSRS) si des chantillons
alatoires simples sont slectionns dans chaque strate.
Echantillonnage
27 avril 2015
77 / 198
Mthodes dchantillonnage
Dcomposition
On note Nh la taille de la strate Uh . Un total ty peut se dcomposer sous
la forme
H
X
ty =
tyh ,
h=1
H
1 X
Nh yh ,
N
h=1
Echantillonnage
27 avril 2015
78 / 198
Mthodes dchantillonnage
nh
Nh
kl =
nh (nh 1)
.
Nh (Nh 1)
nh nh0
.
Nh Nh0
Echantillonnage
27 avril 2015
79 / 198
Mthodes dchantillonnage
H
X
tyh =
h=1
H
X
Nh yh
h=1
ty
H
X
Vp tyh .
h=1
Echantillonnage
27 avril 2015
80 / 198
Mthodes dchantillonnage
H
X
1 fh 2
ty =
Nh2
Syh
nh
avec
2
Syh
=
h=1
X
1
(yk yh )2 ,
Nh 1
kUh
avec
s2yh =
X
1
(yk yh )2 ,
nh 1
kSh
h=1
Echantillonnage
27 avril 2015
81 / 198
Mthodes dchantillonnage
y =
H
X
Nh
h=1
yh .
H
X
Nh 2 1 fh 2
[
y ] =
s .
N
nh yh
h=1
Echantillonnage
27 avril 2015
82 / 198
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
83 / 198
Mthodes dchantillonnage
On suppose que la taille globale dchantillon n est fixe, et que les strates
ont t dfinies.
On doit choisir les tailles n1 , . . . , nH des sous-chantillons slectionner
dans chaque strate.
Nous revenons sur quelques allocations classiques pour le sondage alatoire
simple stratifi :
Allocation Proportionnelle,
Allocation Optimale,
Allocation de compromis.
Echantillonnage
27 avril 2015
84 / 198
Mthodes dchantillonnage
Allocation Proportionnelle
Echantillonnage
27 avril 2015
85 / 198
Mthodes dchantillonnage
Allocation Proportionnelle
Nh
.
N
Autrement dit, plus la strate est grande, plus lchantillon slectionn dedans
est grand.
Echantillonnage
27 avril 2015
86 / 198
Mthodes dchantillonnage
Allocation Proportionnelle
Chaque unit de la population possde la mme probabilit dinclusion k =
n/N , et lestimateur stratifi de la moyenne est identique la moyenne
simple sur lchantillon :
y =
H
X
Nh
h=1
yh =
H
X
nh
h=1
yh = y.
Echantillonnage
27 avril 2015
87 / 198
Mthodes dchantillonnage
H
X
Nh 1
|h=1
'
PH
N 1
{z
2
Syh
+
2
Sy,intra
Nh 2
h=1 N Syh
H
X
Nh
(yh y )2
N 1
{z
}
|h=1
2
Sy,inter
PH
Nh
h=1 N (yh
y )2
Echantillonnage
27 avril 2015
88 / 198
Mthodes dchantillonnage
1
1
0
0
2
1
0
0
3
1
0
1
4
1
0
1
5
5
1
1
6
5
1
1
7
5
1
0
8
5
1
0
Echantillonnage
27 avril 2015
89 / 198
Mthodes dchantillonnage
La variance de lestimateur stratifi avec allocation proportionnelle est approximativement donne par
1f 2
Sy,intra ,
Vp ty ' N 2
n
de sorte que :
le SRS stratifi allocation proportionnelle est (presque) toujours plus
efficace que le SRS,
la stratification devrait tre choisie de faon ce que la dispersion
lintrieur des strates soit minimise.
Echantillonnage
27 avril 2015
90 / 198
Mthodes dchantillonnage
Allocation de Neyman
Echantillonnage
27 avril 2015
91 / 198
Mthodes dchantillonnage
Principe
t.q.
H
X
nh = n
h=1
Echantillonnage
27 avril 2015
92 / 198
Mthodes dchantillonnage
Principe
Avec un sondage alatoire simple stratifi, ce problme de minimisation peut
se rcrire :
H
X
1
1
2
Nh2 Syh
min
nh
nh Nh
t.q.
h=1
H
X
nh = n.
h=1
Echantillonnage
27 avril 2015
93 / 198
Mthodes dchantillonnage
Principe
Echantillonnage
27 avril 2015
94 / 198
Mthodes dchantillonnage
Calcul de lallocation
Echantillonnage
27 avril 2015
95 / 198
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
96 / 198
Mthodes dchantillonnage
Principe
H
X
1
1
2
Nh2 Syh
nh Nh
t.q.
h=1
C0 +
H
X
Ch nh = C.
h=1
Echantillonnage
27 avril 2015
97 / 198
Mthodes dchantillonnage
Allocation de compromis
Echantillonnage
27 avril 2015
98 / 198
Mthodes dchantillonnage
1
1
nh Nh
2
Syh
= Cste.
nh = n PH
2
j=1 Syj
Echantillonnage
27 avril 2015
99 / 198
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
100 / 198
Mthodes dchantillonnage
Principales questions
Echantillonnage
27 avril 2015
101 / 198
Mthodes dchantillonnage
Introduction
Echantillonnage
27 avril 2015
102 / 198
Mthodes dchantillonnage
Algorithmes de tirage
Il existe en pratique des dizaines dalgorithmes de tirage permettant de respecter un jeu de probabilits dinclusion fix (voir Till, 2006). Nous dtaillerons deux de ces algorithmes :
le tirage poissonien,
le tirage systmatique.
Les diffrents algorithmes se distinguent par les probabilits dinclusion dordre
2 obtenues, i.e. par la variance des estimateurs. Cependant, il nexiste pas
dalgorithme uniformment prfrable en termes de variance.
Le choix de la mthode utiliser dpend de la connaissance que lon a de la
base de sondage mais aussi des contraintes pratiques sur lchantillonnage.
Echantillonnage
27 avril 2015
103 / 198
Mthodes dchantillonnage
Est-ce que lalgorithme est de taille fixe, i.e. ne slectionne que des
chantillons de la taille (moyenne) voulue ?
sont > 0 : assure quon dispose dun estimateur sans biais de variance.
vrifient les conditions de Yates-Grundy : assure quon dispose dun
estimateur toujours positif de variance (pour un plan de taille fixe).
Echantillonnage
27 avril 2015
104 / 198
Mthodes dchantillonnage
Le tirage de Poisson
Echantillonnage
27 avril 2015
105 / 198
Mthodes dchantillonnage
Principe
Cest une gnralisation du tirage de Bernoulli au cas des probabilits ingales :
Etape 1 : on gnre u1 U [0, 1]. Si u1 1 , lunit 1 est retenue dans
lchantillon.
Etape 2 : on gnre u2 U [0, 1] indpendamment de u1 . Si u2 2 ,
lunit 2 est retenue dans lchantillon.
...
Etape N : on gnre uN U [0, 1] indpendamment de u1 , . . . , uN 1 .
Si uN N , lunit N est retenue dans lchantillon.
Cest un principe de piles ou faces indpendants, avec une pice et un lancer
diffrents pour chaque unit.
Echantillonnage
27 avril 2015
106 / 198
Mthodes dchantillonnage
Estimation de Horvitz-Thompson
En utilisant les proprits dune loi U [0, 1], on a :
P(k S) = P(uk k ) = FU (k ) = k .
Du fait de lindpendance dans la slection des units :
kl = k l si k 6= l.
Le plan de sondage peut tre entirement spcifi. Pour une partie quelconque s = {i1 , . . . , ip } de U , on a :
Y
Y
P(S = s) =
k
(1 k ).
ks
ku\s
Echantillonnage
27 avril 2015
107 / 198
Mthodes dchantillonnage
Application
Dans la population ci-dessous, utiliser les nombres alatoires pour slectionner un chantillon selon un tirage de Poisson, et en dduire une estimation
de ty .
Unit
k
uk
yk
Tirage
1
0.1
0.07
0
2
0.1
0.44
0
3
0.1
0.52
1
4
0.1
0.19
2
5
0.4
0.95
2
6
0.4
0.24
2
7
0.4
0.54
2
8
0.4
0.07
4
Echantillonnage
27 avril 2015
108 / 198
Mthodes dchantillonnage
Estimateur de Horvitz-Thompson
La variance sobtient partir de lexpression gnrale de Horvitz-Thompson :
X yk 2
k (1 k ),
Vpois ty =
k
(8)
kU
X yk 2
kS
(1 k ).
Echantillonnage
27 avril 2015
109 / 198
Mthodes dchantillonnage
N
t .
y
N
(9)
kU
(10)
kS
avec ek = yk
ty
.
N
Echantillonnage
27 avril 2015
110 / 198
Mthodes dchantillonnage
ty
,
N
de variance (approximative)
Vpois [
y ] '
1 X Ek 2
k (1 k ).
N2
k
(11)
kU
1 X ek 2
(1 k ).
2
k
N
(12)
kS
Echantillonnage
27 avril 2015
111 / 198
Mthodes dchantillonnage
Utilisation
Le tirage poissonien est rarement utilis pour un tirage dchantillon, en
raison de sa grande variance. On trouve cependant des applications dans le
cas dchantillonnage forestier (Schreuder et al., 1993).
Le tirage poissonien est galement utilis dans un contexte de non-rponse.
On parle de non-rponse totale quand certains individus chantillonns ne
peuvent finalement pas tre enquts. Pour exploiter lchantillon de rpondants, not Sr , il est gnralement ncessaire de modliser le mcanisme de
rponse.
Une modlisation classique consiste supposer que lchantillon Sr est obtenu par sous-chantillonnage dans lchantillon S dorigine. Plus de dtails
dans le cours sur les Donnes Manquantes (Attachs).
Echantillonnage
27 avril 2015
112 / 198
Mthodes dchantillonnage
Le tirage systmatique
Echantillonnage
27 avril 2015
113 / 198
Mthodes dchantillonnage
Principe
Cest une mthode simple et trs rapide permettant de slectionner un chantillon probabilits ingales et de taille fixe.
Principe :
On pose Vk =
Pk
l=1 l
On tire une variable alatoire u selon une loi uniforme U [0, 1].
On slectionne toutes les units k telles que, pour un entier i {1, . . . , n} :
Vk1 u + (i 1) < Vk .
Echantillonnage
27 avril 2015
114 / 198
Mthodes dchantillonnage
Exemple
Population U de taille N = 14 avec n = 4 :
1 = 2 = 5 = 6 = 7 = 8 = 12 = 1/7,
3 = 4 = 9 = 10 = 11 = 13 = 14 = 3/7.
0
?
V0 V1 V2
V3
?
V4 V5 V6 V7 V8
?
V9
V10
V11V12
?
V13
V14
Echantillonnage
27 avril 2015
115 / 198
Mthodes dchantillonnage
Probabilits dinclusion
Echantillonnage
27 avril 2015
116 / 198
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
117 / 198
Mthodes dchantillonnage
n/N
0
si k l [p],
sinon.
Il nexiste pas destimateur sans biais de variance, et les conditions de YatesGrundy ne sont pas vrifies.
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
118 / 198
Mthodes dchantillonnage
Exemple
Slection dun chantillon de taille 3 dans une population de taille 12 selon
un tirage systmatique probabilits gales (k = 41 ).
0
?
V0
V1
V2
V3
?
V4
V5
V6
V7
?
V8
V9
V10
V11
V12
Echantillonnage
27 avril 2015
119 / 198
Mthodes dchantillonnage
tous les individus contenus dans les grappes de sI sont retenus dans
lchantillon s finalement enqut.
Echantillonnage
27 avril 2015
120 / 198
Mthodes dchantillonnage
N X
Yi ,
n
ui SI
P
avec Yi = kui yk le total sur la grappe ui . En utilisant les rsultats du
SRS, on obtient
1 f SY2
Vsys ty = N 2
n n
avec
SY2
X
ty 2
1
Yi
.
p1
p
ui Ug
Echantillonnage
27 avril 2015
121 / 198
Mthodes dchantillonnage
Vp ty
VSRS ty
SY2 /n
.
Sy2
Sy2
n1 X 2
(p 1) 2
Syi +
S
N 1
n(N 1) Y
(13)
i=1
'
1X 2
1 2
Syi +
S /n .
p
n Y
i=1
Echantillonnage
27 avril 2015
122 / 198
Mthodes dchantillonnage
Echantillonnage
27 avril 2015
123 / 198
Mthodes dchantillonnage
Exemple
Considrons une population U de taille 12 sur laquelle on relve trois caractristiques y1 , y2 , y3 (valeur moyenne 40) :
Unit
y1
y2
y3
1
10
10
15
2
10
45
45
3
10
60
10
4
15
15
60
5
45
50
60
6
45
65
50
7
50
10
45
8
50
50
65
9
60
60
10
10
60
10
50
11
60
45
10
12
65
60
60
Echantillonnage
27 avril 2015
124 / 198
Mthodes dchantillonnage
Exemple
On obtient comme valeurs chantillonnes possibles pour y1
{10, 50} {10, 50} {10, 60} {15, 60} {45, 60} {45, 65},
pour y2
{10, 10} {45, 50} {60, 60} {15, 10} {50, 45} {65, 60},
et pour y3
{15, 45} {45, 65} {10, 10} {60, 50} {60, 10} {50, 60}.
On obtient galement :
DEFFp (y)
Guillaume Chauvet (ENSAI)
y1
0.50
y2
2.18
Echantillonnage
y3
1.39
27 avril 2015
125 / 198
Mthodes de redressement
Mthodes de redressement
Echantillonnage
27 avril 2015
126 / 198
Mthodes de redressement
Principe
Nous revenons au cas de lestimation dun total. On suppose quun chantillon S a t slectionn selon un plan de sondage p(). Un estimateur direct
est donn par :
X
X yk
=
dk yk .
ty =
k
kS
kS
Echantillonnage
27 avril 2015
127 / 198
Mthodes de redressement
Principe
Echantillonnage
27 avril 2015
128 / 198
Mthodes de redressement
Principe
Echantillonnage
27 avril 2015
129 / 198
Mthodes de redressement
Echantillonnage
27 avril 2015
130 / 198
Mthodes de redressement
Principe
On suppose ici que lon dispose dun vecteur xk = [x1k , . . . , xpk ]> de variables auxiliaires, dont les totaux tx = [tx1 , . . . , txp ]> sur la population sont
connus.
Avant calage, on a pour toute variable y lestimateur sans biais du total :
X
ty =
dk yk ,
kS
Ep ty = ty ,
et en particulier pour les variables de calage :
Ep tx = tx .
Echantillonnage
27 avril 2015
131 / 198
Mthodes de redressement
ks
Echantillonnage
27 avril 2015
132 / 198
Mthodes de redressement
Echantillonnage
27 avril 2015
133 / 198
Mthodes de redressement
Solution thorique
On choisit une fonction de distance G telle que G(wk /dk ) mesure la distance
entre le poids initial dk et le poids final wk . Nous supposons que
G(1) = 0,
G est positive et convexe (i.e, plus wk /dk sloigne de 1, plus G(wk /dk )
est grand)
Le Lagrangien scrit
!
L=
ks
wk x k t x
ks
Echantillonnage
27 avril 2015
134 / 198
Mthodes de redressement
Echantillonnage
27 avril 2015
135 / 198
Mthodes de redressement
> tx tx
= ty + b
avec
"
=
b
X xk x>
#1
kS
X xk yk
kS
Echantillonnage
27 avril 2015
136 / 198
Mthodes de redressement
Echantillonnage
27 avril 2015
137 / 198
Mthodes de redressement
Echantillonnage
27 avril 2015
138 / 198
Mthodes de redressement
Echantillonnage
27 avril 2015
139 / 198
Mthodes de redressement
avec
Vm [k ] = k2 .
(14)
kU
et ek = yk b
> xk pour obtenir
On les remplace par leurs estimateurs b
> t
b
| {z x}
prdiction du total
Guillaume Chauvet (ENSAI)
te
|{z}
Echantillonnage
27 avril 2015
140 / 198
Mthodes de redressement
En utilisant lapproximation ty,greg ' ty + b> tx tx , on obtient :
h
i
Ep ty,greg ' Ep ty + b> {tx tx }
= ty ,
Vp ty,greg
h
i
' Vp ty b> tx
= Vp tE .
Echantillonnage
27 avril 2015
141 / 198
Mthodes de redressement
On se place dans le cas dun SRS(n). On suppose que lon utilise les variables
auxiliaires xk = [1, xk ]> , de totaux connus. Le modle de rgression sousjacent est :
yk = a + b xk + Ek .
On obtient
P
b=
b =
En notant =
(x x )(yk y )
kU
P k
2
kU (xk x )
(x
x)(yk
y)
kS
P k
x) 2
kS (xk
sxy
s2x
Sxy
Sx Sy
Sxy
Sx2
a = y b x
a
= y b x
1f 2
Vsrs ty,greg ' N 2
Sy (1 2 ).
n
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
142 / 198
Mthodes de redressement
Echantillonnage
27 avril 2015
143 / 198
Mthodes de redressement
X Ek El
kl
k l
k,lU
Echantillonnage
27 avril 2015
144 / 198
Mthodes de redressement
Estimation de variance
X ek el kl
k l kl
k,lS
v2 tyw =
X gk ek gl el kl
,
k l kl
k,lS
Echantillonnage
27 avril 2015
145 / 198
Mthodes de redressement
Estimation de variance
Echantillonnage
27 avril 2015
146 / 198
Mthodes de redressement
Exemple
Echantillon de taille n = 5 tir selon un SRS dans une population de taille
N = 100. On suppose connu le total tx = 320.
x0k
1
1
1
1
1
x1k
1
3
2
5
4
yk
3
1
8
15
3
1f 2
tx = 300 ty = 600 v(ty ) = N 2
s = 6.08 104
n y
Echantillonnage
27 avril 2015
147 / 198
Mthodes de redressement
Exemple
Echantillon de taille n = 5 tir selon un SRS dans une population de taille
N = 100. On suppose connu le total tx = 320.
x0k
1
1
1
1
1
x1k
1
3
2
5
4
yk
3
1
8
15
3
ek = yk a
b x1k
0.8
-5
3.9
5.2
-4.9
1f 2
tx = 300 ty = 600 v(ty ) = N 2
s = 6.08 104
n y
a
= 0.3 b = 1.9
1f 2
tyw = 638 v(tyw ) = N 2
s = 4.365 104
n e
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
148 / 198
Echantillonnage
27 avril 2015
149 / 198
Echantillonnage
27 avril 2015
150 / 198
avec wk = dk
tx
.
tx
Echantillonnage
27 avril 2015
151 / 198
Motivation
Lestimateur par le ratio est motiv par le modle
yk = xk + k
avec
Vm [k ] = 2 xk .
kS
ty
,
=R
tx
et
te =
X yk b
> xk
kS
Guillaume Chauvet (ENSAI)
X yk R
xk
kS
Echantillonnage
= 0.
27 avril 2015
152 / 198
Exemple de donnes
y/x
20
40
60
80
100
2
1
120
0 20
60
100
20
40
60
80
100
120
Echantillonnage
27 avril 2015
153 / 198
Echantillonnage
27 avril 2015
154 / 198
Echantillonnage
27 avril 2015
155 / 198
Echantillonnage
27 avril 2015
156 / 198
Exemple
Echantillon de taille n = 5 tir selon un SRS dans une population de taille
N = 100. On suppose connu le total tx = 320.
xk
1
3
2
5
4
yk
3
1
8
15
3
tx = 300
ty = 600
Echantillonnage
2
v(ty ) = N 2 1f
n sy
4
= 6.08 10
27 avril 2015
157 / 198
Exemple
Echantillon de taille n = 5 tir selon un SRS dans une population de taille
N = 100. On suppose connu le total tx = 320.
xk
1
3
2
5
4
yk
3
1
8
15
3
xk
ek = yk R
1
-5
4
5
-5
tx = 300
ty = 600
= 2
R
tyR = 640
Echantillonnage
2
v(ty ) = N 2 1f
n sy
4
= 6.08 10
2
v(tyR ) = N 2 1f
n se
4
= 4.37 10
27 avril 2015
158 / 198
1 cvx
2 cvy
q
p
Sx2 /x et cvy = Sy2 /y .
Echantillonnage
27 avril 2015
159 / 198
,
Sy R
Vsrs tyR Vsrs ty,greg ' N
n
Sy
avec ty,greg lestimateur par la rgression simple obtenu avec le vecteur xk =
(1, xk )> .
Lestimateur par la rgression simple est donc toujours meilleur (asymptotiquement) que lestimateur par le ratio dans le cas dun sondage alatoire
simple.
Echantillonnage
27 avril 2015
160 / 198
Echantillonnage
27 avril 2015
161 / 198
= tx PH
ty,RC = tx
tx
h
h=1 Nh x
et sa variance est approximativement gale
Vp ty,RC ' Vp tE
=
H
X
Nh2
h=1
1 fh 2
SEh .
nh
Echantillonnage
27 avril 2015
162 / 198
xk .
avec ek = yk R
Dun autre ct, si les totaux par strate txh sont connus, on peut appliquer
un redressement par le ratio strate par strate.
On obtient lestimateur par le ratio spar
ty,RS =
H
X
H
X
tyh
yh
=
txh .
txh
x
h
t xh
h=1
h=1
Echantillonnage
27 avril 2015
163 / 198
h xk et R
h = tyh /txh .
avec ek = yk R
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
164 / 198
Estimateur post-stratifi
Estimateur post-stratifi
Echantillonnage
27 avril 2015
165 / 198
Estimateur post-stratifi
Principe
On suppose que lon connat aprs le tirage de lchantillon une partition de la population en H groupes nots U1 , . . . , UH . On parle de poststratification.
Les effectifs des post-strates, nots N1 , . . . , NH , sont supposs connus.
Le -estimateur peut se rcrire
ty =
H X
X
yk
k
h=1 kSh
H
X
tyh
h=1
avec Sh lintersection de S et de Uh .
Guillaume Chauvet (ENSAI)
Echantillonnage
27 avril 2015
166 / 198
Estimateur post-stratifi
Principe de post-stratification
Lestimateur post-stratifi est dfini par
typost =
H
X
Nh
yh ,
h=1
avec
yk
kSh k
P
1
kSh k
yh =
tyh
h
N
Echantillonnage
27 avril 2015
167 / 198
Estimateur post-stratifi
Motivation
Lestimateur post-stratifi est motiv par le modle
yk = h + k
et
X xk x>
k
k2 k
#1
kS
X xk yk
k2 k
kS
T
[
y1 , . . . ,
yH ] ,
et
> xk yk
ek = yk b
yh pour k Uh .
Echantillonnage
27 avril 2015
168 / 198
Estimateur post-stratifi
h = 1, . . . , H.
Echantillonnage
27 avril 2015
169 / 198
Estimateur post-stratifi
H
X
Nh yh
avec
h=1
yh =
1 X
yk .
nh
kSh
Echantillonnage
27 avril 2015
170 / 198
Echantillonnage
27 avril 2015
171 / 198
Les variables auxiliaires les plus explicatives doivent tre utilises pour
le calage (slection avec une PROC GLM, par exemple).
Les variables utilises pour concevoir le plan de sondage doivent tre
utilises pour le calage (ex : variables de stratification).
Si le calage est utilis pour compenser de la non-rponse, les variables
explicatives de la probabilit de rponse devraient tre incluses dans le
calage.
Echantillonnage
27 avril 2015
172 / 198
En principe, plus on utilise de variables de calage, plus les rsidus sont faibles
et donc plus la variance de lestimateur cal diminue. En pratique :
le nombre de variables de calage doit rester faible devant la taille de
lchantillon,
les variables les plus explicatives sont gnralement suffisantes pour
obtenir une forte diminution de la variance.
Echantillonnage
27 avril 2015
173 / 198
Cest possible avec la macro CALMAR 2, qui permet dutiliser jusqu trois
niveaux dinformation auxiliaire. Par exemple, pour une enqute auprs des
mnages :
information auxiliaire sur les units primaires (ex : les communes),
information auxiliaire sur les mnages,
information auxiliaire sur les individus.
Echantillonnage
27 avril 2015
174 / 198
Echantillonnage
27 avril 2015
175 / 198
Echantillonnage
27 avril 2015
176 / 198
Echantillonnage
27 avril 2015
177 / 198
Echantillonnage
27 avril 2015
178 / 198
Mthode linaire
Mthode Logit
LO = valeur
Borne Infrieure pour les rapports de poids ( spcifier si M=3 ou 4).
Echantillonnage
27 avril 2015
179 / 198
UP = valeur
Borne Suprieure pour les rapports de poids ( spcifier si M=3 ou 4).
SEUIL = valeur
Seuil dterminant larrt de lalgorithme de Newton (optionnel).
MAXITER = valeur entire
Nombre maximum ditrations de lalgorithme de Newton (optionnel).
Echantillonnage
27 avril 2015
180 / 198
Echantillonnage
27 avril 2015
181 / 198
POIDSFIN = variable
Nom de la variable donnant les poids cals.
LABELPOI = label
Label associ la variable donnant les poids cals.
OBSELI = OUI ou NON
Si OBSELI=OUI, cre une table SAS OBSELI avec, pour chaque unit
supprime de lchantillon dorigine, la variable identifiante, les variables de
calage et les poids initiaux.
Echantillonnage
27 avril 2015
182 / 198
Un petit exemple
Echantillonnage
27 avril 2015
183 / 198
Echantillonnage
27 avril 2015
184 / 198
Echantillonnage
27 avril 2015
185 / 198
Echantillonnage
27 avril 2015
186 / 198
Echantillonnage
27 avril 2015
187 / 198
Echantillonnage
27 avril 2015
188 / 198
Echantillonnage
27 avril 2015
189 / 198
Echantillonnage
27 avril 2015
190 / 198
Echantillonnage
27 avril 2015
191 / 198
Echantillonnage
27 avril 2015
192 / 198
Echantillonnage
27 avril 2015
193 / 198
Echantillonnage
27 avril 2015
194 / 198
Echantillonnage
27 avril 2015
195 / 198
Echantillonnage
27 avril 2015
196 / 198
Bibliographie
Ardilly, P. (2005). Panorama des principales mthodes destimation sur petits domaines. Actes des Journes de Mthodologie Statistique, Insee.
Ardilly, P. (2006), Les Techniques de Sondage, Technip, Paris.
Ardilly, P., et Till, Y. (2003), Exercices corrigs de mthodes de sondage Sondage,
Technip, Paris.
Cochran, W.G (1977), Sampling Techniques, Wiley, New-York.
De Peretti, P. et al (2006). Lenqute sans-domicile 2001. Insee Mthodes, 116,
Paris.
Deville, J-C. (1991). Une thorie des enqutes par quotas. Techniques dEnqute,
17, 177-195.
Hajek, J. (1964). Asymptotic theory of rejective sampling with varying probabilities
from a finite population. Annals of Mathematical Statistics, 35, 1491-1523.
Echantillonnage
27 avril 2015
197 / 198
Bibliographie
Echantillonnage
27 avril 2015
198 / 198