Vous êtes sur la page 1sur 19

Nouvelles techniques d'échantillonnage et

de redressement
Chapitre 1

Mohammed El Haj Tirari

Institut National de Statistique et d'Economie Appliquée

2020-2021

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Plan de sondage équilibré

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Plan de sondage équilibré

Supposons que J caractères auxiliaires z1 , . . . , zJ soient disponibles : les


valeurs des vecteurs
0
zk = (zk1 . . . zkj . . . zkJ )

soient connues pour tout k ∈ U .


Comme les valeurs de ces caractères sont connues, on peut disposer de
leur totaux :
!0
X X X X
tz = zk = zk1 . . . zkj . . . zkJ
k∈U k∈U k∈U k∈U

Objectif : mettre à prot cette information auxiliaire au moment de tirage


de l'échantillon.

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Plan de sondage équilibré

Dénition
Un plan de sondage p est équilibré sur les caractères z1 , . . . , zJ , si et seulement
si il vérie les équations d'équilibrage données par
X zk X
= zk
πk
k∈S k∈U

qui peut s'écrire tzπ = tz


b
où !0
X zk1 X zkj X zkJ
tzπ =
b ... ...
πk πk πk
k∈S k∈S k∈S

Les équations d'équilibrage peuvent également s'écrire


X zkj X
= zkj
πk
k∈s k∈U

pour tout s ∈ Ω tel que p(s) > 0, et pour tout j = 1, . . . , p.


Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1
Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Plan de sondage équilibré

Exemple
Un plan de sondage de taille xe n est équilibré sur une seule
variable zk = πk , k ∈ U
un plan de sondage stratié est équilibré sur les variables indicatrices
d'appartenance aux strates z1 , . . . , zp où

si

1 k ∈ Uh
zkh =
0 si k 6∈ Uh

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Soit pz un plan équilibré sur les caractères z1 , . . . , zJ dont les probabilités


d'inclusion d'ordre un et deux dont πk et πkl .
la variance de b
tyπ sous le plan pz est donnée par
!
X yk XX yk yl
V arpz = (πkl − πk πl )
πk πk πl
k∈S k∈U l∈U
0
= y̆ ∆y̆


π1 (1 − π1 ) ··· π1N − π1 πN
 
 π21 − π2 π1 ··· π2N − π2 πN 
∆= .. .. ..
 
. . .

 
πN 1 − πN π1 ··· πN (1 − πN )
et  0
y1 yk yN
y̆ = ... ...
π1 πk πN

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Remarques

La variance de b
tyπ sous le plan pz dépend des πkl qui sont
extrêmement dicile à calculer (voire impossible).
−→ Il faut chercher une approximation adéquate des πkl

Pour cela, on fait appel au plan de Poisson et à ces propriétés


théoriques intéressantes :
La variance de b
tyπ peut être facilement calculée car elle dépend
uniquement des πk .
Pour des probabilités d'inclusion xées, le plan de Poisson est le plan
qui maximise l'entropie donnée par
X
− p(s)log (p(s))
s∈Ω

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Plan de Poisson

Les probabilités d'inclusion du plan de Poisson sont dénies par :


πk = P (k ∈ S) et πkl = P (k ∈ S)P (l ∈ S) = πk πl

La probabilité de sélectionner un échantillon s est dénie par :


Y Y
p(s) = πk (1 − πk )
k∈s k∈U \s

La variance du π estimateut du total est donnée par :


X y2
k
var(b
tyπ ) = (1 − πk )
πk
k∈U

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Entropie d'un plan de sondage

Quand on construit un plan de sondage, on veut bien qu'il soit le plus


aléatoire possible. L'aspect aléatoire d'un plan de sondage peut être
mesuré par l'Entropie.
Dénition
On appelle l'entropie d'un plan de sondage la quantité
X
I(p) = − p(s) log p(s)
s∈Ω

où on suppose que 0 log 0 = 0.

L'entropie est toujours positive et plus elle est élevé, plus le plan de
sondage est aléatoire.

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Plan de Poisson

Propriété
1 Le plan de Poisson est le plan de sondage à entropie maximale sur

l'ensemble Ω de probabilités d'inclusion xées πk avec k ∈ U .


2 Le plan de sondage équilibré est équivalent à un plan de Poisson
conditionné par les contraintes d'équilibrage.
3 Le plan de sondage équilibré est le plan de sondage à entropie
maximale sur l'ensemble Ω des échantillons vériant la contrainte
d'équilibrage.

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Résultat
Si le plan équilibré pz est d'entropie maximale ou proche de l'entropie
maximale, la variance de b tyπ sous le plan pz peut être calculée comme la
variance conditionnelle d'un plan de Poisson particulier de probabilités
d'inclusion π
ek :
  
V arpz b
tyπ = V arpois btyπ | b
tzπ = tz

Les probabilités π
ek sont inconnues et doivent être déterminées.

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

On note que si Se est l'échantillon aléatoire sélectionné au moyen d'un


plan de Poisson et π
ek les probabilités d'inclusion d'ordre un de ce plan,
on a
 
X yk X y2
k
V arpois   = ek (1 − π
π ek )
πk πk2
k∈S
e k∈U
0
= y̆ Cy̆

où C est la matrice diagonale dont les éléments sont π ek ) avec


ek (1 − π
k ∈ U.

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Approximation de la variance de tyπ


b sous le plan équilibré

Résultat
Sous l'hypothèse que, pour un plan de Poisson, la distibution du vecteur
 0
0
b tzπ est approximativement une distribution normale multivariée, on a
tyπ b

0
   
V arpois btyπ | b
tzπ = tz ≈ V arpois btyπ + (tz − b
tzπ ) B


h  i−1  
B = V arpois btzπ Covpois btzπ , b
tyπ
 0 −1 0
= Z̆ CZ̆ Z̆ Cy̆

V arpois est la variance sous le plan de Poisson de probabilités π


ek .

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Approximation de la variance de tyπ


b sous le plan équilibré

avec
  X z z0 0
k k
V arpois btzπ = ek (1 − π
π ek ) = Z̆ CZ̆
πk2
k∈U
  Xz y 0
k k
Covpois btzπ , b
tyπ = ek (1 − π
π ek ) = Z̆ Cy̆
πk2
k∈U
 0
z1 zk zN
Z̆ = ... ...
π1 πk πN
 0
y1 yk yN
y̆ = ... ...
π1 πk πN
et C est la matrice diagonale dont les élements diagonaux sont
ek ).
ek (1 − π
ck = π

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Approximation de la variance de tyπ


b sous le plan équilibré

Ainsi l'approximation de V arpz (b


tyπ ) est donnée par :
 
V arpz (b
tyπ ) = V arpois btyπ | b
tzπ = tz
 0

≈ V arpois btyπ + (tz − b
tzπ ) B
0
≈ y̆ ∆app y̆

où  0 −1 0
∆app = C − CZ̆ Z̆ CZ̆ Z̆ C

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Approximation de la variance de tyπ


b sous le plan équilibré

qui peut également s'écrire


XX yk yl
tyπ ) ≈
V arpz (b ∆app,kl
πk πl
k∈U l∈U


 0
 0
−1
zk zi zi zk
si
P
 ck − ck πk i∈U ci πi2 πk ck k=l


∆app,kl = 0
 0
−1
 ck πzk zi zi zl
si
 P

k
c
i∈U i π 2 πl cl k 6= l
i

avec ck = π ek ).
ek (1 − π

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Approximation de la variance de tyπ


b sous le plan équilibré

Exemple
Dans le cas d'un plan de sondage de taille xe n où il y a une seule
variable d'équilibrage : zk = πk , k ∈ U , on a
 2
 ck −
 P ck
ci si k=l
i∈U
∆app,kl =
Pck cl si k 6= l


i∈U ci
2
πk ) 2
si

ek (1 − π
ek ) − Pπ (1−e
 π k=l
ek
i∈U π ei (1−e πi )

=
π (1−eπk )e
πl (1−e
πl )
si

 ekP
k 6= l
i∈U π
ei (1−eπi )

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Attention c'est pas encore ni . . .

Comme les probabiltés d'inclusion π ek du plan de Poisson associé au


plan équilibré pz sont inconnues, les poids ck = π ek ) sont
ek (1 − π
également inconnus.

−→ Il faut les approximer


Plusieurs approximations des poids ck peuvent être considérées dont
la plus est celle proposé par Deville et Tillé (2004) :

ck1 = πk (1 − πk )

obtenue en considérant que lorsque n est grand, πk ≈ πek qui est la


probabilité d'inclusion d'ordre un du plan équilibré.

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1


Principe et dénition
Plan de sondage équilibré Variance de tbyπ
Variance de tbyπ sous le plan de Poisson

Estimation de la variance de tyπ


b pour un plan équilibré

L'estimateur de la variance de b
tyπ peut être donné par
XX yk yl
Vd
arpz (b
tyπ ) = ∆∗app,kl
πk πl
k∈S l∈S

avec
 0
 0
−1
∗ ∗ zk ∗ zi zi zk ∗
si
P
 ck − ck πk i∈U ci πi2 πk ck k=l


∆∗app,kl = 0
 0
−1
 c∗k πzk ∗ zi zi zl ∗
si
 P

k
c
i∈U i π 2 πl cl k 6= l
i


c∗k1 = (1 − πk )

Mohammed El Haj Tirari Nouvelles techniques d'échantillonnage et de redressement Chapitre 1

Vous aimerez peut-être aussi