Académique Documents
Professionnel Documents
Culture Documents
!Vincent Loonis*
Les mthodes de slection des chantillons des enqutes de lInsee auprs des mnages ont connu ces dernires
annes de profondes modifications: transformation du recensement de la population; mergence de nouvelles bases
de sondage. Paralllement, la demande sociale se diversifie, augmente ses exigences et soriente vers lobservation
de populations de plus en plus spcifiques. Il en rsulte une complexification des processus dchantillonnage qui
doivent toujours rpondre la double contrainte de qualit statistique et doprabilit. Au total, les grands principes de
construction des chantillons des enqutes mnages nont pas chang mais sorientent vers la satisfaction de demandes de plus en plus prcises. Pour ce faire, avec le recours quasi systmatique lchantillonnage quilibr ou la
mthode du partage des poids, les outils rcents mis disposition par les avances de la thorie des sondages sont
mobiliss.
Source : Wikipdia
25
Vincent Loonis
qute Trajectoires et origines (TeO) ;
enqute Sans-domicile 2001... Il faut
dans ces cas mettre en place pour
chaque enqute une mthodologie
ad hoc, adapte aux attentes des
concepteurs mais qui rpond galement aux contraintes organisationnelles de lInstitut. Les enqutes en
population gnrale dont le protocole est particulier rentrent galement
dans cette catgorie. Lchantillon de
100000 logements enquts par voie
postale de lenqute Vie quotidienne
et sant (VQS) en 2007 en est un
exemple. La future enqute Famille
prvue pour tre la premire associe
au nouveau recensement en 2011
en constitue un autre. Compte tenu
des attentes croissantes vis--vis de
la statistique publique, la frquence
des chantillonnages ad hoc a eu
tendance fortement augmenter ces
dernires annes.
Le protocole particulier de lenqute
Emploi en continu pourrait contribuer
classer cette enqute parmi les
chantillonnages ad hoc. Son importance dans le systme statistique et
sa prennit conduisent cependant
la considrer comme un cas part.
26
La stratification
Quand linformation auxiliaire est qualitative, on utilise le sondage stratifi.
Sondage quilibr
Pour gnraliser au cas o linformation auxiliaire disponible est la fois
qualitative et quantitative, une solution est le sondage quilibr. Si lide
de cette mthode est ancienne, elle
na trouv que rcemment, (Deville
et Till, 2004), un cadre thorique
Source: Insee
Dans chaque strate catgorie dfinie par les modalits des variables
auxiliaires on ralise des sondages alatoires simples. En pratique,
les critres de stratification les plus
utiliss sont les rgions, et/ou une
typologie plus raffine de lespace :
tranche dunits urbaines, zonage en
aires urbaines, typologie Tabard des
quartiers et communes selon la profession et lactivit conomique de
leurs habitants.
chantillon de population
Les mthodes lmentaires permettant de satisfaire les contraintes externes sont principalement le sondage
plusieurs degrs, le sondage en deux
phases et la mthode du partage des
poids, mme si cette dernire nest
pas proprement parler une mthode
dchantillonnage.
27
Vincent Loonis
logements, alors tous les logements
ont la mme probabilit dappartenir
lchantillon. Cette proprit est
intressante dun point de vue statistique et pratique.
En thorie des sondages, chaque
variable ou thme dintrt a son propre plan de sondage optimal avec
son systme de pondration adapt.
Dans la pratique, les enqutes sont
multi thmes, ce qui signifie quil
faudrait autant dchantillons que de
thmes ! Cest irralisable. Choisir
un plan de sondage avec probabilit
dinclusion constante nest donc optimal pour aucun thme, mais assure
que lchantillon retenu ne conduira
une catastrophe pour aucun thme
trait. Cest pourquoi, dans la plupart
des enqutes de lInsee, lquipondration est recherche. Cette quipondration sentend ventuellement au
sein dune catgorie de population.
Dun point de vue pratique, les avantages sont vidents. Au dernier degr,
on sarrange pour choisir un nombre
de logements qui est compatible avec
la charge de travail des enquteurs :
ni trop faible afin que celle-ci soit
suffisante pour assurer le revenu des
enquteurs ou pour justifier les cots
de formation, ni trop important afin
que les enquteurs aient le temps de
raliser toutes les interviews dans les
dlais prescrits.
La contrepartie des sondages plusieurs degrs est une moindre efficience en termes de prcision quun
sondage alatoire simple de taille
quivalente. Cet argument est cependant la plupart du temps fallacieux
car il nintgre pas les cots denqutes. La vraie comparaison entre
ces deux types de sondages devrait
soprer sous contrainte de budget
et de structure des cots constants.
Malheureusement, ce ne peut que
rarement tre tabli.
28
Le cas de lchantillon-matre
29
Vincent Loonis
Pour une enqute donne on slectionne dans chaque zone un nombre fixe de logements ce qui assure
lquipondration in fine. Quand un
chantillon est slectionn, il est marqu: les logements ne pourront plus
tre choisis pour une enqute
future. On montre que ce principe ne
modifie pas le calcul des probabilits
tout en permettant dassurer la disjonction: un logement ne pourra tre
enqut quune seule fois au cours
dun cycle de recensement.
videmment, la pratique est un peu
diffrente de celle prsente ici. Pour
autant, les raffinements mthodologiques supplmentaires, qui peuvent
parfois tre trs complexes, ne changent pas la philosophie densemble.
Pour plus de dtails, sur la pratique
on pourra se reporter MarcChristine
et Sbastien Faivre, 2009.
30
Diverses personnes
tes conduit ce que lon soit nettement plus exigeant sur les distances
parcourir dans lEEC que dans une
enqute classique o la collecte peut
staler sur plusieurs mois. A la limite,
on cherche obtenir que les logements attribus un enquteur soient
contigus si bien quil ne perdra pas de
temps dans les dplacements.
Ce type de contrainte classe lchantillon de lEEC dans les chantillons
dits arolaires. On ne slectionne pas
directement des logements mais des
aires de 20 logements contigus. Tout
le problme est de disposer dune
base de sondage arolaire affectant
chacun des quelques 32 millions de
logements une aire. Dans lchantillon actuel, qui est sur le terrain
depuis 2001 (Christine, 2002), cette
base a t obtenue en suivant une
logique descendante partir du
recensement 1999.
31
Vincent Loonis
Bibliographie
G. Chauvet et Y. Till, 2006, A Fast Algorithm of Balanced Sampling, Computational Statistics, 21-53-61.
M.Christine, 2002, La construction de lchantillon de la future enqute Emploi en continu partir du recensement de 1999,
Actes des Journes de Mthodologie Statistique, Insee Mthodes, n100, pp 175-229.
M.Christine et S. Faivre, 2009 Octopusse: un systme dchantillon-matre pour le tirage des chantillons dans la dernire
Enqute Annuelle de Recensement, actes des Xmes Journes de Mthodologie Statistique.
J.-C. Deville et Y. Tills, 2004, Efficient Balanced Sampling: The Cube Method, Biometrika, n91, 893-912.
J.-C. Deville, 1998, Les enqutes par panel: en quoi diffrent-elles des autres enqutes? suivi de: Comment attraper
une population en se servant dune autre. Insee Mthodes, No. 84-85-86, pp.63-82.
L. Ernst, 1989, Weighting issues for Longitudinal Household and Family Estimates. in Panel Surveys (eds Kasprzyk, D.,
Duncan, G., Kalton, G., Singh, M.P. s), John Wiley and Sons, New York, pp.135-159.
P. Lavalle, 2002, Le sondage indirect, ou la mthode gnralise du partage des poids, ditions de lUniversit de Bruxelles.
V. Loonis, 2009, La construction du nouvel chantillon de lenqute Emploi en continu partir des fichiers de la taxe dhabitation, acte des Xmes Journes de Mthodologie Statistique.
F. Tardieu et S. Rousseau, 2004, La macro SAS CUBE dchantillonnage quilibr, disponible sur le site www.insee.fr.
Y. Till, 2001, Thorie des sondages : chantillonnage et estimation en populations finies : cours et exercices, 284 pages,
Paris, Dunod.
32