Vous êtes sur la page 1sur 39

CHAPITRE

TRAITEMENT ET ANALYSES DES DONNEES


Ce chapitre sadresse aux coordinateurs de lenqute, aux spcialistes en traitement et
analyse des donnes et aux personnes-ressources techniques. Il vous aidera :

Prparer le traitement des donnes ;

Mettre en place un systme de gestion du traitement et de lanalyse des donnes ;

Effectuer la saisie des donnes ;

Contrler les donnes et crer un fichier de donnes propre pour lanalyse ;

Produire les tableaux contenant les indicateurs ;

Prparer les fichiers de donnes et la documentation pour lanalyse au-del du


rapport principal, et distribuer les donnes.

Le systme de traitement des donnes de la MICS3 est conu pour produire temps les premiers
rsultats de lenqute quelques semaines seulement aprs la fin des travaux de terrain. Ce chapitre contient des informations qui vous aideront mettre en place un bon planning et une bonne
prparation lavance, qui feront de cet objectif une ralit. Ce chapitre commence par une vue
densemble du systme de traitement des donnes de la MICS3. Ensuite, il prsente de manire
dtaille chacune des composantes, en donnant des rfrences pour des sources dinformation
additionnelles chaque fois que cest ncessaire. Il se termine par une srie de trois listes de
contrle qui vous aideront raliser avec succs le traitement des donnes de votre enqute.

VUE DENSEMBLE
La raison pour laquelle le systme de traitement et danalyse des donnes de la MICS3 permet de
raliser un tel gain de temps, cest le fait que les donnes soient traites en mme temps que les
activits de terrain. Les donnes de chaque grappe sont stockes dans un fichier de donnes spar, et sont traites ds que les questionnaires sont ramens du terrain. Cette approche subdivise
lopration de traitement et danalyse des donnes en plusieurs tapes, lui permettant davancer
paralllement lvolution de la collecte des donnes sur le terrain. Ainsi, au moment o les derniers questionnaires seront achevs et ramens au Bureau Central, la plupart des donnes aura
dj t traite.
Le traitement et lanalyse des donnes par grappes nest pas une tche difficile, mais elle exige
une organisation trs mticuleuse. Le systme de traitement et danalyse des donnes peut tre
divis en trois phases : la prparation, le traitement primaire des donnes et le traitement secondaire des donnes. Chacune de ces phases est rsume dans les sections qui suivent, et chacune delles a sa propre liste de contrle la fin de ce chapitre.

7.2

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES


Tableau 7.1
Le Systme de Traitement et dAnalyse des Donnes de la MICS3
Saisie des donnes primaires
Agent de saisie 1

Contrle de la structure
Agent de saisie 1

Structure correcte ?

Correction du fichier des donnes primaires


Agent de saisie 1

Non

Rechercher les Erreurs


Superviseur du traitement des donnes

Oui
Saisie des donnes de vrification
Agent de saisie 2

Correction des deux fichiers de donnes


Agents de saisie 1 & 2

Vrification
Superviseur du traitement des donnes

Diffrences ?

Oui

Dtermination des valeurs correctes


Agents de saisie 1 & 2

Non
Archivage du fichier des donnes primaires
Superviseur du traitement des donnes

Apurement Secondaire
Superviseur du traitement des donnes

Incohrences ?

Non
Archivage du fichier des donnes apures
Superviseur du traitement des donnes

Correction du fichier des donnes brutes


Superviseur du traitement des donnes

Oui

Correction des Incohrences


Agent de vrification

TRAITEMENT DES DONNEES

7.3

PREPARATION DE LA SAISIE DES DONNEES


La prparation de la phase de saisie des donnes a pour finalit de permettre le dmarrage de la
saisie des donnes quelque temps seulement aprs le dbut des travaux de terrain. Les principales
tapes de cette phase sont les suivantes :
Acquisition de lquipement informatique et prparation de la salle ou de lespace pour le
traitement des donnes ;
Identification et recrutement du personnel appropri ;
Adaptation des programmes informatiques en fonction des spcificits des questionnaires
du pays ;
Mise en place dun systme de gestion des questionnaires et des fichiers des donnes.
TRAITEMENT PRIMAIRE DES DONNEES
Le but du traitement primaire des donnes est de produire des fichiers de donnes propres et apurs. Le traitement primaire des donnes implique les tapes suivantes :

Saisie de tous les questionnaires dune grappe dans un fichier de donnes ;


Contrle de la structure du fichier de donnes ;
Deuxime saisie des donnes et vrification du fichier de donnes ;
Sauvegarde du fichier de donnes contrles et vrifies ;
Apurement secondaire du fichier des donnes ;
Sauvegarde du fichier de donnes apures, ou fichier final.

Le processus de traitement primaire des donnes est rsum dans le schma de la page prcdente. Il est important de noter que le contrle de la structure, la vrification de la saisie des donnes et lapurement secondaire sont des procdures itratives, qui doivent tre rptes autant de
fois que ncessaire, jusqu la rsolution de tous les problmes dtects, ou jusqu ce que ces
derniers soient considrs comme acceptables.
TRAITEMENT SECONDAIRE DES DONNEES
Le but du traitement secondaire des donnes est de produire des fichiers danalyse des donnes et
de crer les tableaux standards de la MICS3. Le traitement secondaire des donnes implique les
tapes suivantes :

Concatnation de tous les fichiers de donnes de grappes en un fichier de donnes ;


Exportation des donnes vers le logiciel SPSS ;
Calcul des pondrations ;

7.4

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES


Cration de lindice de richesse1 ;
Recodification des variables pour simplifier lanalyse ;
Prparation et sortie des tableaux requis pour lanalyse des donnes ;
Archivage et distribution des fichiers de donnes.

PERSONNEL ET INFRASTRUCTURE
PERSONNEL
Pour la MICS3, lquipe de traitement et danalyse des donnes comprend quatre types de personnel : un archiviste, des agents de saisie, des operateurs en charge de lapurement secondaire
des donnes et un superviseur du traitement et de lanalyse des donnes. Des responsabilits distinctes sont assignes chacune de ces fonctions, et le fait de les combiner pourrait compromettre la qualit de vos donnes.
Larchiviste a pour tche de contrler et de classer les questionnaires qui rentrent du terrain.
Lorsque les documents dune grappe arrivent au niveau du bureau de traitement des donnes,
il/elle vrifie que tous les questionnaires sont effectivement prsents et prts tre saisis. Si des
questionnaires sont manquants, il/elle devra rsoudre ce problme avec laide de lquipe de terrain (les tapes prcises que larchiviste doit suivre sont dtailles plus bas).
Les agents de saisie ont pour tche la saisie des donnes. Ils doivent aussi avoir une exprience
dans le domaine de saisie et une bonne connaissance des questionnaires de lenqute. Une manire dy parvenir est de faire participer les agents de saisie la formation des enquteurs. Avant
le dmarrage de la saisie, une session de formation spcifique de 2-3 jours devrait tre organise,
afin de permettre aux agents de saisie de se familiariser avec les programmes et les masques de
saisie, et pour leur permettre davoir un temps de pratique. Avant la fin de la saisie, les agents de
saisie devraient tre laise avec le programme de saisie et tre conscients de leurs responsabilits quotidiennes. Le nombre dagents de saisie ncessaires dpend du nombre dordinateurs disponibles, et ce point est trait en dtail dans les sections qui suivent.
Les agents de vrification ont pour tche de rechercher et de traiter les incohrences complexes
releves par le programme dapurement secondaire. Ils doivent avoir une trs bonne connaissance des questionnaires et des objectifs de lenqute. Les procdures dapurement sont fournies
dans lAnnexe Sept en vue de les aider dans le processus dapurement secondaire des donnes.
Habituellement, un ou deux agents de vrification seront en mesure de faire tout le travail.
Le superviseur du traitement des donnes est un membre particulirement important de
lquipe de traitement et danalyse des donnes de lenqute. Il a en charge ladaptation des pro1

Encore appel Indice de Bien-tre Economique

TRAITEMENT DES DONNEES

7.5

grammes modles aux spcificits des questionnaires utiliss dans le pays, ainsi que la supervision de toutes les activits de traitement et danalyse. Le superviseur du traitement des donnes
doit avoir une bonne exprience dans la gestion des oprations de traitement informatique
denqutes de grande envergure ou de recensements, une parfaite maitrise des questionnaires et
des comptences avres dans lutilisation et la programmation avec les logiciels CSPro et SPSS.
Le superviseur du traitement des donnes doit tre disponible plein temps durant la priode de
saisie, dapurement et de tabulation.
Le superviseur du traitement des donnes doit tre identifi suffisamment lavance pour tre
impliqu dans la rvision des questionnaires de la MICS3. Il doit tre consult, afin de sassurer
que les codes utiliss dans les questionnaires sont appropris et sans ambigut et que toutes les
informations relatives lidentification dont on a besoin en font partie. Le superviseur du traitement des donnes sera galement en mesure de contribuer la rvision finale des questionnaires,
sur la base de lexprience acquise lors de la saisie des questionnaires du pr-test.
MATERIEL INFORMATIQUE ET AUTRES EQUIPEMENTS
Les quipements ncessaires pour le traitement et lanalyse des donnes sont lists ci-dessous :

Ordinateurs pour la saisie des donnes ;


Ordinateur du superviseur du traitement des donnes ;
Un priphrique secondaire de sauvegarde des donnes (un port USB ou un lecteur de
CD-RW) ;
Des disquettes (ou tout autre moyen permettant aux agents de saisie de transfrer les fichiers de donnes vers lordinateur du superviseur du traitement des donnes, par exemple par rseau) ;
Une imprimante ;
Du papier ;
Des cartouches dencre/rubans dimprimante ;
Des interrupteurs lectriques de scurit ;
Des onduleurs (UPS) ;
Des bics verts.

Il est recommand que les ordinateurs dont on se servira pour la saisie des donnes aient un processeur de type Pentium, utilisent Windows 95 ou plus, aient au minimum 32 mgaoctets de
mmoire (RAM) et au moins un disque dur dun gigaoctet, ainsi quun lecteur de disquettes de
3,5 pouces (ou soit mis en rseau). Le nombre dordinateurs dont on a besoin pour lexploitation
de lenqute dpendra de la taille de lchantillon, du nombre dheures de saisie hebdomadaire,
du local disponible et du calendrier de lenqute. Pour avoir le nombre dordinateurs dont on a
besoin pour la saisie des donnes, il faut estimer le temps moyen de saisie des questionnaires
dun mnage par agent, et le multiplier par le nombre de mnages attendus en fonction de la
taille de lchantillon. Si vous ntes pas en mesure destimer le temps ncessaire pour saisir les
questionnaires, utilisez 20 30 minutes comme une moyenne gnrale de saisie par mnage ; ce-

7.6

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

la dpendra du nombre attendu de femmes et denfants par mnage. Il faut multiplier ce temps
estim par le nombre de mnages pour obtenir le nombre dheures ncessaires pour la saisie des
donnes. Il faut maintenant diviser cette dernire estimation par le nombre dheures de saisie
hebdomadaire par agent ; puis il faut encore diviser par le nombre de semaines dont vous aurez
besoin pour achever la saisie des donnes (si vous comptez finir cette saisie une semaine aprs
avoir reu les derniers questionnaires du terrain).
Si, par exemple, la taille de lchantillon de lenqute est de 6.000 mnages, et si chaque mnage
prend en moyenne 20 minutes de saisie, le temps ncessaire pour la saisie de lensemble des mnages est de 2.000 heures. Si vous avez 8 semaines pour achever la saisie des donnes, 250 heures de travail hebdomadaire seront ncessaires. Si chaque agent de saisie travaille 40 heures par
semaine, vous aurez besoin de 7 ordinateurs et de 7 agents de saisie. Il arrive parfois quune
quipe de deux agents de saisie travaillent sur le mme ordinateur. Chaque agent travaillera par
exemple pendant 6 heures, de telle sorte quun ordinateur soit employ pendant 12 heures par
jour.
Le superviseur du traitement des donnes devrait disposer dun ordinateur plus puissant, avec un
processeur plus rapide, Windows 98 ou plus, au moins 64 mgaoctets de RAM, un disque dur
dun gigaoctet ou plus, ainsi quun lecteur de disquettes de 3,5 pouces (ou soit mis en rseau
avec les ordinateurs des agents de saisie), et un second priphrique de stockage des donnes
pour les copies de sauvegarde des fichiers de donnes.
Des interrupteurs lectriques de scurit et des onduleurs (UPS) sont ncessaires dans les pays
affects par de frquentes coupures de courant lectrique. Les bics verts doivent tre utiliss
chaque fois quun membre de lquipe de traitement des donnes modifie les donnes dun questionnaire. Lencre de couleur verte permet de distinguer ces changements des donnes dorigine
enregistres par les agents enquteurs (avec de lencre bleue) et toute modification effectue par
lquipe de terrain (avec de lencre rouge).
LOGICIELS
Les programmes standards pour le traitement et lanalyse des enqutes MICS3 ont t dvelopps dans CSPro 2.6 et SPSS. CSPro qui a t utilis par plusieurs services de statistiques travers le monde pour le traitement des recensements et des enqutes, a t dvelopp en partenariat
par United States Census Bureau, ORC Macro International et SerPro Ltd. Il peut tre tlcharg
gratuitement partir du site Web de lUS Bureau of Census2. SPSS est un logiciel commercial
qui est disponible au sige de lUNICEF et auprs de plusieurs fournisseurs de logiciels.

Ladresse du site Web est : http://www.census.gov/ipc/www/cspro/

TRAITEMENT DES DONNEES

7.7

ESPACE DE TRAVAIL
La saisie et lapurement des donnes doivent se faire dans des salles spares. La salle ou
lespace dans lequel les oprations de saisie seront excutes doit avoir suffisamment de place
pour que chaque agent de saisie puisse travailler laise avec son ordinateur et ses questionnaires. Il doit y avoir galement des bureaux ou des tables de travail et des installations lectriques
ncessaires en quantit suffisante. La salle doit tre fraiche, bien claire et autant que possible
elle ne doit pas avoir de poussire ou dhumidit. Si le climat est chaud, la salle doit tre climatise. Pour viter de perdre des donnes en raison des coupures de courant, vous devez utiliser un
onduleur (UPS) pour chaque ordinateur. Si les coupures de courant sont frquentes ou prolonges, il sera ncessaire davoir une autre source de courant de secours telle que les groupes lectrognes.
La salle de vrification et dapurement des donnes est rserve larchiviste et aux agents de
vrification. Elle aussi doit tre fraiche et bien claire, et avoir suffisamment despace pour
permettre aux agents de vrification deffectuer leur travail de rvision des questionnaires dans
de bonnes conditions. Lidal, cest davoir une salle de vrification qui dispose de suffisamment
dtagres ou darmoires rserves pour le stockage des questionnaires qui reviennent du terrain
de manire ordonne. Si les questionnaires ne peuvent pas tre stocks dans la salle de vrification, ils devraient tre stocks proximit de la salle de traitement des donnes, de sorte quils
soient facilement accessibles, puisquon aura besoin de les manipuler pendant toute la dure du
traitement des donnes. Soyez prudent, et ne sous-estimez pas le volume despace dont vous aurez besoin pour stocker les milliers de questionnaires que vous aurez au bureau la fin des oprations de terrain.

ADAPTATION DES PROGRAMMES STANDARDS


Comme nous lavons indiqu au Chapitre 3, le questionnaire modle MIC3 doit tre adapt la
situation de chaque pays. Cela signifie que les programmes modles de saisie, dapurement et de
tabulation des donnes seront galement modifis pour quils soient conformes aux changements
faits dans le questionnaire. Plus on fera des changements dans le questionnaire modle, plus on
devra passer de temps adapter et tester les programmes. Par exemple, si des nouvelles questions sont ajoutes au questionnaire, des ajouts correspondants devront tre faits sur les programmes de saisie, dapurement et de tabulation des donnes.
Cette procdure sera beaucoup plus facile si les numros de questions dans le questionnaire modle sont maintenus. Si des questions sont ajoutes, une lettre devrait tre ajoute au numro de
la question (par exemple, une question ajoute entre WS4 et WS5 devrait tre numrote
WS4A). Par ailleurs, si des questions sont limines, les questions restantes ne doivent pas tre
renumrotes. De mme, lorsque des catgories de codes sont ajoutes celles du questionnaire
modle, elles devraient tre ajoutes la fin de la liste existante, de sorte que les autres codes
restent inchangs. Ladaptation des programmes de saisie et dapurement des donnes doit tre

7.8

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

acheve avant le pr-test. Les questionnaires du pr-test peuvent tre saisis et apurs en utilisant
ces programmes. Cette procdure servira pour deux raisons. Elle identifiera les problmes lis
la codification et aux sauts dans le questionnaire et identifiera galement les erreurs dans les programmes. Une fois le pr-test achev et le questionnaire finalis, les changements dfinitifs peuvent tre faits aux programmes. Les sections qui suivent donnent des directives de base pour la
modification des modles de dictionnaires des donnes et des modles dapplications de CSPro.
Des directives plus dtailles sur le contenu des applications de CSPro sont prsentes dans
dautres documents.
Mme dans le cas o vous najoutez pas de questions aux questionnaires modles, les modles de
dictionnaires des donnes et les modles dapplications comportent des lments qui doivent imprativement tre mis jour (il sagit, par exemple, de ltendue acceptable pour la date de
linterview, ltendue acceptable pour le numro de la grappe, etc.). Ces lments sont spcifiques chaque pays, et ne peuvent tre remplis que par vous. Alors, mme si votre pays utilise le
questionnaire modle, vous devriez procder ladaptation des programmes standards.

LES DICTIONNAIRES DES DONNEES


Dans lEnqute par Grappes Indicateurs Multiples, les groupes de questions couvrant le mme
thme (par exemple, la mortalit maternelle, lutilisation de la contraception et la vaccination)
sont regroupes dans des modules, qui eux-mmes sont regroups dans des questionnaires (pour
le mnage, pour les femmes individuellement et pour les enfants de moins de cinq ans). Dans
CSPro, le dictionnaire des donnes sert dcrire cette structure des donnes : un groupe de variables portant sur le mme thme (questions) constitue un enregistrement (module), et un groupe
denregistrements constitue un niveau (questionnaire). Ces derniers sont stocks dans un fichier
dictionnaire (qui a comme extension : dcf). En plus du dictionnaire des donnes, les formulaires
lis au dictionnaire sont utiliss pour la saisie des donnes. Habituellement, il y a un formulaire
pour chaque enregistrement. Les formulaires sont stocks dans un fichier de formulaires (qui a
comme extension : fmf). Les fichiers dcf et fmf peuvent tre modifis directement. La meilleure
manire de le faire est douvrir le fichier de formulaires dans CSPro. Cela vous permettra
daccder en mme temps au dictionnaire des donnes et aux formulaires, et de vous assurer que
les deux demeurent synchroniss. Il est recommand de conserver une copie de sauvegarde du
modle de dictionnaire des donnes et du fichier des formulaires pour rfrence.
Il existe trois types de questionnaires pour la MICS3. Le Questionnaire Individuel de la Femme
et le Questionnaire des Enfants de Moins de Cinq Ans correspondent une unit primaire
danalyse : une femme et un enfant respectivement. Le Questionnaire Mnage comporte deux
units danalyse : le mnage et les membres du mnage. Tous les types de questionnaires sont
stocks dans mics3.dcf et entry.fmf.

TRAITEMENT DES DONNEES

7.9

VARIABLES ET NIVEAUX DIDENTIFICATION


Dans CSPro, chaque questionnaire doit avoir une srie de variables qui lidentifient de manire
unique. Par exemple, un mnage est identifi par son numro de grappe et son numro mnage.
Les variables qui permettent didentifier un questionnaire sont connues sous le nom de variables
didentification. Le Tableau 7.2 ci-dessous liste les types de questionnaires et leurs variables
didentification.
Tableau 7.2
Types de Questionnaires et leurs Variables dIdentification
Questionnaire
Mnage

Numro de Grappe
HH1

Numro Mnage
HH2

Numro de Ligne

Femmes

HH1

HH2

LN

Enfants

HH1

HH2

LN

Comme le montre le tableau, les femmes et les enfants ont les mmes variables didentification.
Etant donn que chaque membre du mnage est list sur une ligne distincte dans la Feuille
dEnregistrement du Mnage, deux femmes ou deux enfants ne sauraient avoir le mme numro
de ligne, mme sils sont dans le mme mnage. Ainsi, le numro de ligne, lorsquil est combin
avec le numro de grappe et le numro mnage, identifie de manire unique la femme ou
lenfant.
Dans un dictionnaire CSPro, un niveau est dfini par un ensemble de variables didentification. Il
y a deux niveaux dans le dictionnaire de la MICS3 : les mnages et les individus (autrement dit,
les femmes ligibles et les enfants ligibles). Les mnages constituent le premier niveau, alors
que les femmes et les enfants composent le second niveau. Cette structure hirarchique est naturelle, car dans le questionnaire de la MICS3, chaque femme ou chaque enfant appartient un
mnage, alors quun mnage donn peut avoir plusieurs femmes et enfants.
Les questionnaires individuels femmes et les questionnaires enfants sont stocks au mme niveau, car ils sappliquent tous deux aux membres du mnage. Lapplication de saisie des donnes
contient une logique qui saute les formulaires appartenant aux enfants lors de la saisie du questionnaire dune femme, et saute les formulaires appartenant aux femmes lors de la saisie du questionnaire dun enfant. Ainsi, bien que les questionnaires femmes et les questionnaires enfants
soient tous deux stocks comme des cas de niveau deux, ils nont pas de variables communes,
hormis les variables didentification.
MODULES
Le dictionnaire des donnes a t conu pour reflter la structure modulaire des questionnaires de
la MICS3. Chaque module est stock dans son propre enregistrement (exceptions : le module
dEnregistrement du Mnage et le module des Orphelins et Autres Enfants rendus Vulnrables

7.10

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

du fait du VIH/SIDA comptent chacun deux enregistrements, cause de leur structure inhabituelle) dans mics3.dcf et chaque enregistrement a un formulaire (ou deux, dans le cas du module
sur les Caractristiques du Mnage) qui lui est associ dans entry.fmf. Ainsi, si votre pays
nutilise pas un module, vous pouvez lenlever en supprimant son enregistrement et son formulaire (et en retirant toute autre logique qui y fait rfrence dans lapplication de saisie des donnes).
Les modules disponibles pour le Questionnaire Mnage (avec leurs codes modules lists entre
parenthses) sont : les Informations du Mnage (HH), lEnregistrement du Mnage (HL et TO),
lEducation (ED), lEau et lAssainissement (WS), les Caractristiques du Mnage (HC), les
Moustiquaires Imprgnes aux Insecticides (TN), les Orphelins et autres Enfants rendus Vulnrables par le VIH/SIDA (OV et OR), le Travail des Enfants (CL), la Discipline de lEnfant (CD),
lHandicap (DA), la Mortalit Maternelle (MM) et lIodation du Sel (SI).
Les modules disponibles pour le Questionnaire Individuel des Femmes sont : le Cadre
dInformation des Femmes (WM), la Mortalit des Enfants (CM), lAnatoxine Ttanique (TT),
la Sant de la Mre et du Nouveau-n (MN), les Unions/Mariage (MA), la Scurit de la Proprit et la Durabilit du Logement (ST), la Contraception (CP), les Mutilations Gnitales Fminines/Excision (FG), les Attitudes vis--vis de la Violence Conjugale (DV), le Comportement
Sexuel (SB) et le VIH/SIDA (HA).
Les modules disponibles pour le Questionnaire des Enfants de Moins de Cinq Ans sont : le Cadre
dInformation des Enfants de Moins de Cinq Ans (UF), lEnregistrement des Naissances et
lEducation de la Petite Enfance (BR), le Dveloppement de lEnfant (CE), la Vitamine A (VA),
lAllaitement (BF), les Soins des Enfants Malades (CA), le Paludisme (ML), la Vaccination (IM)
et lAnthropomtrie (AN).
CONVENTIONS DE LIBELLES DES VARIABLES
Les variables sont nommes selon le module du questionnaire dans lequel elles sont situes et le
numro de la question dont elles contiennent la rponse. Par exemple, la question 9 de
lEnregistrement du Mnage est stocke dans la variable dnomme HL9. Certaines questions
sont constitues de deux ou plusieurs parties, dont chacune est identifie par une lettre distincte.
Pour de telles questions, chaque partie est stocke dans une variable distincte. Les noms de ces
variables distinctes incluent les lettres qui distinguent les diffrentes parties de la question. Par
exemple, la question 11 du module sur la Sant de la Mre et du Nouveau-n comporte deux parties. La premire partie de la question est stocke dans la variable MN11A, et la seconde partie
est stocke dans MN11.
Certaines questions comportent deux ou plusieurs catgories de rponses. Ces questions sont
stockes dans une variable individuelle et les catgories de rponses sont dfinies comme des
sous-items. Lorsque ces questions concernent des dates, les lettres d (pour jour), m (pour
mois) et y (pour anne) sont ajoutes au nom de la variable de base pour crer le nom des

TRAITEMENT DES DONNEES

7.11

sous-items. Dans la question 6 du Panneau dInformation des Femmes, par exemple, le jour, le
mois et lanne de naissance de la femme sont requis. Les rponses correspondantes sont stockes dans WM8, qui a trois sous-items : wm8d, wm8m et wm8y.
Certaines questions ont une structure dans laquelle la premire partie de la rponse en est la
forme alors que la seconde partie est la rponse elle-mme. Ces questions sont stockes dans une
variable unique ; quant la forme et la rponse elle-mme, elles sont dfinies comme des sousitems. Le nom du sous-item stockant la forme de la rponse est le nom de la variable laquelle la
lettre u (pour units) est adjointe, alors que le nom du sous-item stockant la rponse ellemme est le nom de la variable laquelle la lettre n (pour nombre) est adjointe. Par exemple,
la question 13 du module sur la Sant de la Mre et du Nouveau-n enregistre la dure coule
entre la naissance de lenfant et sa premire mise au sein. La personne enqute peut donner une
rponse en heures ou en jours. La rponse est stocke dans la variable mn13, aux sous-items
mn13u et mn13n.
QUESTIONS A REPONSES MULTIPLES ET VARIABLES ALPHANUMERIQUES
Un certain nombre de questions acceptent des rponses multiples. Dans les questionnaires, ces
questions sont caractrises par des rponses codes alphanumriques (autrement dit, les lettres
A Z). Dans le dictionnaire des donnes, la rponse une question rponses multiples est
stocke dans une variable alphanumrique, dont la longueur est gale au nombre maximum de
rponses possibles. Ce sont l les seules variables alphanumriques du dictionnaire. Chaque variable alphanumrique comporte un sous-item pour chaque code de rponse du questionnaire. Le
nom de chacun de ces sous-items est le nom de la variable plus le code de la rponse que ce
sous-item reprsente.
Par exemple, la seconde question du module sur la Sant de la Mre et du Nouveau-n enregistre
toutes les personnes ayant fourni la femme des soins prnatals avant sa dernire naissance. Les
codes de rponses possibles sont A, B, C, F, G, H, X et Y. Par consquent, la variable mn2 a une
longueur de huit caractres, et elle comporte huit sous-items : mn2a, mn2b, mn2c, mn2f, mn2g,
mn2h, mn2x et mn2y.
CONVENTIONS DE CODIFICATION
Les modles de dictionnaires utilisent des codes standards pour certaines rponses. Nous commencerons par prsenter les conventions de codification pour les variables numriques. La rponse Autre est toujours code avec un 6 prcd dun ou plusieurs 9. Les rponses incohrentes sont toujours codes avec un 7 prcd dun ou plusieurs 9. La rponse Ne Sait Pas est
toujours code avec un 8 prcd dun ou plusieurs 9. Les questions avec rponse manquante
(autrement dit, l o lagent enquteur na pas enregistr de rponse une question pourtant applicable) sont toujours codes avec 9 prcd dun ou plusieurs 9. Les questions qui ne sont pas
applicables la personne enqute sont toujours codes comme vides. Le Tableau 7.3 ci-dessous
prsente de manire rsume les conventions de codification standards.

7.12

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

Tableau 7.3
Rsum des Conventions de Codification Standards
Rponse

Autre
Non/Aucun
Incohrent
Ne Sait Pas
Manquante
Non applicable

Alphabtique

Un caractre

X
Y
NA
Z
?
Vide

6
NA
7
8
9
Vide

Longueur de la Variable
Deux caractres Trois caractres
96
NA
97
98
99
Vide

996
NA
997
998
999
Vide

Quatre caractres
9996
NA
9997
9998
9999
Vide

Etant donn que les codes allant de 6 9 sont rservs pour un usage particulier, toute question
qui comporte plus de six catgories de rponses devrait avoir des catgories de rponses deux
chiffres, prcds dun zro (par exemple, 01, 02, 03, 04, 05, 06, 07, 96, 97, 98 et 99).
Pour les variables alphanumriques, la rponse Autre est toujours code X, la rponse Ne Sait
Pas est toujours code Z, une valeur manquante est toujours code en utilisant le point
dinterrogation ( ? ), et non applicable est toujours cod comme un vide.
ETENDUES
La plupart des questions figurant dans les questionnaires de la MICS3 ont des tendues de rponses dj prdfinies. Pour les variables, les tendues sont dfinies dans le dictionnaire mics3.dcf.
Lors de la saisie des donnes, CSPro vrifie que toute valeur saisie dans une variable fait partie
de ltendue prdfinie pour cette variable. CSPro accepte plusieurs tendues pour chaque variable, ainsi, des questions qui ont des tendues de rponses qui ne se suivent pas (par exemple, 1-8,
96, 98 et 99) devraient tre dfinies en tenant compte de plusieurs tendues (par exemple, 1-8,
96, 98 et 99, plutt que 1-99). Certes, les tendues du dictionnaire sont utiles pour le contrle des
tendues simples, mais des tendues plus compliques ou conditionnelles (par exemple, la cohrence entre le jour et le mois au sein dune variable de date) devraient tre galement vrifies
dans les applications de saisie des donnes ou dapurement de ces dernires.

LE PROGRAMME DE SAISIE DES DONNEES


Lapplication de saisie des donnes est un programme long et complexe. Des contraintes
despace nous empchent de le prsenter de manire dtaille dans ce chapitre. En lieu et place,
cette section va mettre laccent sur certains des points importants concernant lapplication de saisie des donnes.

TRAITEMENT DES DONNEES

7.13

SAUTS
Les questionnaires de la MICS3 font un large usage des sauts. Les sauts sont des instructions figurant dans le questionnaire et qui disent lagent enquteur de sauter toutes les questions situes entre la question actuelle et une question situe plus bas dans le questionnaire. Les sauts figurant dans le questionnaire devraient tre en conformit avec les sauts correspondants dans le
programme de saisie des donnes. Les sauts du programme de saisie des donnes dfinissent le
chemin de saisie des donnes. CSPro applique de manire stricte le chemin de saisie des donnes
lorsque les commandes skip to ou skip to next sont utilises.
MESSAGES DERREURS
Lorsquun agent de saisie entre, pour une variable, une valeur qui est incohrente avec une information dj entre, il est utile dafficher un message derreur. Ce message derreur devrait expliquer la nature du problme et fournir toute information qui pourrait aider la rsolution de
lincohrence. Dans CSPro, la fonction errmsg affiche un message derreur, avec un texte dfini
par lutilisateur, chaque fois quelle est sollicite. Les messages derreur du programme de saisie des donnes sont nombreux, et ils sont stocks dans le fichier entry.mgf. Le texte, les nombres
et les incohrences qui entrainent laffichage de chacun de ces messages derreur sont lists dans
lAnnexe Sept, de mme que les directives suivre pour leur rsolution.
Il vous appartiendra de passer en revue le questionnaire pour dterminer si les questions qui y ont
t ajoutes ncessitent des contrles de cohrence. Le cas chant, vous devriez ajouter des logiques pour vrifier la cohrence soit dans le programme de saisie des donnes, soit dans le programme dapurement des donnes, ou alors dans les deux programmes. Lorsque vous y ajoutez
un contrle de cohrence, assurez-vous que le message derreur correspondant a t ajout au fichier de messages de saisie des donnes ou dapurement des donnes. De mme, si vous ajoutez
des messages derreur, veillez ne pas utiliser un numro de message derreur dj existant.
Certains messages derreur sont suivis de la commande reenter, qui renvoie au champ qui est entrain dtre saisi actuellement. Cela oblige lagent de saisie rgler lerreur avant de continuer la
saisie. Etant donn quil sera souvent demand lagent de saisie de procder aux corrections,
une supervision rapproche de cette activit sera ncessaire. Lorsque vous insrez vos propres
messages derreur, il est important que vous rflchissiez soigneusement au fait de savoir si vous
voulez obliger lagent de saisie rsoudre le problme avant de poursuivre la saisie. Si cest le
cas, faites suivre votre message derreur par la commande reenter.
VARIABLES ALPHANUMERIQUES
Lapplication de saisie des donnes vrifie que les variables alphanumriques sont correctement
saisies. Elle effectue quatre contrles sur chaque variable alphanumrique. Dabord, elle vrifie
que la valeur saisie fait partie des codes lists dans le questionnaire (autrement dit, elle effectue
un contrle de ltendue). Ensuite, elle vrifie que les rponses sont saisies selon lordre alphab-

7.14

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

tique (autrement dit, ACG et non GAC). Puis elle vrifie, pour les cas o les codes Ne Sait Pas
ou Aucun (gnralement la lettre Y) font partie de la rponse, quaucune autre rponse nest
prsente (autrement dit, elle nacceptera pas la rponse ACY). Enfin, elle vrifie, pour les cas
o un code manquant ( ? ) fait partie de la rponse, quaucune autre rponse nest prsente
(autrement dit, elle nacceptera pas la rponse AC?)
Lapplication de saisie des donnes rarrange les valeurs saisie dans les variables alphanumriques, de sorte que chaque rponse est stocke lendroit exact qui dfinit son sous-item. Par exemple, pour la variable mn2, la rponse ACG sera rarrange en A C G , o il y a un vide entre A et C, et entre C et G, et trois vides aprs G.
FONCTIONS DEFINIES PAR LUTILISATEUR
Une caractristique trs intressante de CSPro rside dans le fait quil accepte que les programmes dfinissent leurs propres fonctions. De telles fonctions sont dnommes fonctions dfinies
par lutilisateur, et elles peuvent tre trs utiles. En particulier, elles vitent de rcrire un code
frquemment utilis. Les fonctions dfinies par lutilisateur sont toujours indiques tout en haut
dune application CSPro. Lapplication de saisie des donnes entry.app comprend 14 fonctions
dfinies par lutilisateur. Il nest pas ncessaire de modifier ces fonctions, mais vous devriez
comprendre ce quoi elles servent, si vous voulez comprendre lapplication de saisie des donnes.
La fonction valid vrifie si la valeur de la variable est lune des valeurs spciales : incohrente,
ne sait pas, manquante ou non applicable. Si la valeur de la variable est non applicable, la fonction natozero la change en 0, lui permettant dtre ajoute une autre variable (Voir la procdure cm9 pour un exemple de son utilisation).
Les sept fonctions dfinies par lutilisateur suivantes (zscoef, dabs, zspct, zseval, zscr, zsanth et
agemth) sont utilises dans le Questionnaire des Enfants de Moins de Cinq Ans, pour calculer les
scores anthropomtriques qui se trouvent la fin du module sur lAnthropomtrie. On recoure
la fonction agemth pour calculer lge de lenfant en mois. Il est alors fait recours la fonction
zsanth. Cette fonction fait appel zseval, zscr et zspct. La fonction zseval fait appel zscoef, et
zspct fait appel dabs. Vous ne rencontrerez ces fonctions que pour les variables anthropomtriques, et si vous les rencontrez, vous saurez quelles sont entrain de calculer, puis de vrifier les
scores anthropomtriques.
Le code de la fonction agemth calcule lge de lenfant en mois. Etant donn que
lanthropomtrie est particulirement sensible lge, lge de lenfant devra tre bas sur lge
de lenfant en jours. Tout dabord, le code calcule le nombre de jours couls entre le dbut de
lanne et la naissance de lenfant. Ensuite, il calcule le nombre de jours couls entre le dbut
de lanne et la date de linterview. La diffrence entre ces deux nombres de jours donne lge de
lenfant en jours. Ce chiffre est alors converti en ge de lenfant en mois en le divisant par
30,4375 (qui est le nombre moyen de jours dans un mois au cours dune priode de quatre ans).

TRAITEMENT DES DONNEES

7.15

Pour des raisons de prcision, lge de lenfant en mois est calcul avec deux chiffres aprs la
virgule.
Les fonctions vdvalid, vdoi et vdob vrifient que les dates de vaccination saisies dans le module
sur la Vaccination sont cohrentes, ne sont situes, ni aprs la date de linterview, ni avant la date
de naissance de lenfant, respectivement. La fonction endmess (abrviation pour end message)
affiche un message la fin du questionnaire, qui demande lagent de saisie sil dsire passer en
revue le questionnaire en cours ou passer au suivant. Enfin, la fonction alphachk effectue les
contrles sur les variables alphanumriques prsentes en dtail dans la sous-section prcdente.
DATES ET CENTURY MONTH CODE
Les programmes modles (y compris lapplication de saisie des donnes) utilisent les century
month codes (CMC) pour la plupart des dates. Le CMC pour une date est le nombre de mois
couls depuis dcembre 1899. Par exemple, le CMC pour janvier 1900 est 1 ; le CMC pour
mars 2000 est 1203. Le CMC pour une date est calcul de la manire suivante : on soustrait 1900
de lanne de la date, nombre dannes que lon multiplie par 12, ensuite on y ajoute le mois de
la date. Par exemple, le CMC pour mars 2000 est calcul comme suit : (2000-1900) x 12 + 3.
Lapplication de saisie des donnes utilisent quatre fonctions pour simplifier le travail avec les
century month codes. Deux de ces fonctions, setlb et setub, calculent les limites inferieures et suprieures, respectivement, pour le CMC de la date dun vnement. Les deux autres fonctions,
adjlba et adjuba, ajustent les limites inferieures et suprieures, respectivement, de la date dun
vnement (par exemple, lanniversaire dun enfant) lorsquun ge est galement spcifi. Le
Tableau 7.4 ci-dessous rsume ces fonctions.

7.16

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES


Tableau 7.4
Fonctions CSPro Simplifiant le travail avec les Century Month Codes

lcmc = setlb (month, year, minimum);

ucmc = setub (month, year, maximum);

t = adjlba (lcmc, ucmc, di, di, age);


if t < 0 then
e = errmsg (2171);
else
lcmc = t;
endif;

t = adjuba (lcmc, ucmc, di, di, age);


if t < 0 then
e = errmsg (2171);
else
ucmc = t;
endif;

Les arguments de la fonction sont : un mois (month), une anne (year) et un CMC minimum. Si year et month sont tous
deux valides, le CMC est calcul et rendu. Si year nest pas
valide, minimum est rendu. Si month nest pas valide, le CMC
pour le mois de janvier de year est rendu.
Les arguments de la fonction sont : un mois (month), une anne (year) et un CMC maximum. Si year et month sont tous
deux valides, le CMC est calcul et rendu. Si year nest pas
valide, maximum est rendu. Si month nest pas valide, le CMC
pour le mois de dcembre de year est rendu.
Les arguments de la fonction sont : un CMC minimum pour la
date (lcmc), un CMC maximum pour la date (ucmc), le CMC
pour la date de linterview (di), et un age. La fonction augmente lcmc en utilisant age et di. La fonction rend la date produite si elle est suprieure ou gale lcmc et infrieure ou
gale ucmc. Si la date qui en est issue est infrieure lcmc,
la fonction rend lcmc. Si la date qui en rsulte dpasse ucmc,
la fonction rend 1.
Les arguments de la fonction sont : un CMC minimum pour la
date (lcmc), un CMC maximum pour la date (ucmc), le CMC
pour la date de linterview (di), et un age. La fonction rduit
ucmc en utilisant age et di. La fonction rend la date produite si
elle est suprieure ou gale lcmc et infrieure ou gale
ucmc. Si la date qui en est issue est suprieure ucmc, la fonction rend ucmc. Si la date qui en rsulte est moindre que lcmc,
la fonction rend 1.

RECEPTION DES QUESTIONNAIRES VENANT DU TERRAIN


Lorsque les questionnaires dune grappe arrivent du terrain, larchiviste doit contrler le nombre
de questionnaires sur la base de la fiche de contrle de la grappe. Si des questionnaires sont
manquants, larchiviste doit contacter lquipe de terrain pour essayer de retrouver ces questionnaires manquants. Si les questionnaires manquants ne peuvent pas tre retrouvs, lquipe de terrain devra les reprendre si cest possible (autrement dit, si lquipe de terrain se trouve toujours
proximit de la grappe). Si cela nest pas possible, et que le questionnaire manquant est un Questionnaire Mnage, larchiviste devra ajouter un questionnaire vierge (hormis pour les variables
didentification) avec 6 comme code de rsultat, aux questionnaires de la grappe. Si le questionnaire manquant est un questionnaire femme ou enfant, larchiviste devra remplacer le nombre total de questionnaires remplis sur la page de garde du questionnaire mnage auquel la
femme ou lenfant appartient.
Larrive des questionnaires du terrain devrait tre enregistre par larchiviste sur la fiche de suivi de la grappe. Cette dernire est disponible en formats papier et lectronique. Un exemple de la
version papier figure la fin de ce chapitre ; la version lectronique du formulaire est disponible
en passant par le menu du superviseur.

TRAITEMENT DES DONNEES

7.17

Avant de recevoir le moindre questionnaire venant du terrain, les numros dordre des grappes
doivent tre lists par ordre numrique croissant en utilisant autant de fiches de suivi des grappes
que ncessaire. Pour les questionnaires des grappes reus du terrain, il faut enregistrer les informations relatives chaque grappe dans lespace correspondant. De plus, pour chaque grappe,
larchiviste devra vrifier les points suivants :

Tous les questionnaires enregistrs sur la fiche de contrle de la grappe sont l ;


Les Questionnaires mnage, femme et enfant de chaque mnage enqut sont ensemble ;
Les questionnaires sont classs par ordre numrique selon les numros du mnage ;
Tous les questionnaires femme sont mis ensemble par ordre croissant - selon le numro de
ligne de la femme, suivi de tous les questionnaires des enfants, eux aussi classs par ordre
croissant ;
Tous les codes relatifs aux informations didentification gographique et de linterview
sont remplis sur le Panneau dInformation sur le Mnage, au dbut du Questionnaire Mnage.

Une fois que le contrle est achev et que tout problme rencontr est rsolu, larchiviste doit enregistrer le nombre de questionnaires mnages, femmes et enfants sur la fiche de suivi de la
grappe. Il/elle devra aussi crer une fiche de synthse de la grappe. Cette dernire devrait tre un
morceau de papier cartonn poser au-dessus du paquet de questionnaires pour afficher le numro de la grappe en gros caractres. La fiche de synthse de la grappe devra aussi rsumer le nombre de questionnaires de la grappe, tel quindiqu au tableau 7.5 ci-dessous.
Une fois que la fiche de synthse de la grappe aura t cre, le superviseur devra assigner la
grappe un agent de saisie (il faut noter que lagent de saisie auquel la grappe aura t assigne
devra saisir tous les questionnaires de cette grappe). Larchiviste devra ensuite enregistrer le nom
de cet agent de saisie sur la fiche de suivi de la grappe.

7.18

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES


Table 7.5
Exemple de Fiche de Suivi de la Grappe
101
Nombre Total de Questionnaires Mnages

____________

Nombre Total de Mnages Remplis

____________

Nombre Total de Questionnaires Femmes Remplis

____________

Nombre Total de Femmes Remplis

____________

Nombre Total de Questionnaires Enfants Remplis

____________

Nombre Total dEnfants Remplis

____________

Chaque fois que les questionnaires sont dplacs de leur lieu de stockage pour la saisie ou
lapurement, ils doivent de nouveau tre mis en liasse dans le mme ordre et retourns au mme
endroit. Le fait de manipuler les questionnaires dune manire systmatique et stricte rendra les
diffrentes phases du traitement des donnes plus rapides et plus efficaces.
Quand chaque grappe a t enregistre sur le formulaire de suivi de la grappe, les questionnaires
doivent tre remis au superviseur du traitement des donnes, qui devra sassurer quils sont prts
tre envoys la saisie. Les lments de contrle spcifiques qui doivent tre excuts figurent
dans le Tableau 7.6 ci-dessous. Une fois que le contrle est achev et que tout problme rencontr est rsolu, le superviseur affecte la grappe un agent de saisie.

SAISIE DES DONNEES PRIMAIRES


Il est prfrable de commencer la saisie des donnes pendant que les enquteurs sont sur le terrain. Cela permet de reprer et de corriger des erreurs que certains enquteurs ou quipes peuvent
avoir commis. Les problmes srieux qui peuvent chapper lattention du superviseur de terrain
peuvent ainsi tre dtects rapidement, suffisamment tt pour reprendre la formation du personnel de terrain et corriger les erreurs importantes. Les superviseurs de terrain ont pour responsabilit de contrler la compltude et la cohrence des questionnaires, et de classer toutes les rponses que lenquteur na pas pu coder. Comme nous lavons indiqu ci-dessus, le personnel de bureau doit faire le minimum de contrle ncessaire des questionnaires, une fois que ces derniers
arrivent au bureau. Aussitt que les donnes dune grappe arrivent au bureau central, la saisie des
donnes doit commencer.

TRAITEMENT DES DONNEES

7.19

Tableau 7.6
Contrle de Bureau
1. Assurez-vous que tous les Questionnaires de mnage sont classs par ordre croissant par rapport au numro du mnage dans la grappe.
2. Assurez-vous que tous les codes relatifs aux informations didentification gographique et de linterview sont complts sur la page du Cadre dinformation sur le mnage.
3. Lligibilit pour linterview de chaque membre du mnage doit tre vrifie dans la
Feuille dEnregistrement du Mnage. Pour tre ligible aux modules de la femme,
une personne doit tre de sexe fminin et tre ge de 15-49 ans. Pour tre ligible
au module sur le travail des enfants, une personne doit tre ge de 5-14 ans (ou
une tranche dges spcifique au pays). Pour tre ligible au module sur la sant de
lenfant, une personne doit tre ge de moins de 5 ans. Pour chaque personne ligible, le code dligibilit encercl devrait tre celui de son numro de ligne ou du
numro de ligne de la mre ou de la personne en charge de lenfant (HL6-HL8,
Feuille dEnregistrement du Mnage). Pour tous les autres membres du mnage, les
colonnes dligibilit devraient tre laisses vides sur la Feuille dEnregistrement du
Mnage, et devront tre saisies comme 00. Suivez les instructions figurant dans les
Directives dApurement des Donnes (Annexe Six) pour les messages 0101-0132
afin de rsoudre les problmes ventuels.
4. Le nombre total de femmes et denfants ligibles enregistrs dans le Cadre
dInformation sur le Mnage doit correspondre au nombre ligible enregistr sur la
Feuille dEnregistrement du Mnage.
5. Le nombre de questionnaires femme et enfants compltement remplis enregistrs
dans le Cadre dInformation sur le Mnage doit correspondre au nombre de questionnaires ayant 1 (rempli) pour code rsultat pour ce mnage.
6. Assurez-vous que tous les Questionnaires femme sont mis ensemble par ordre
croissant selon le numro de ligne de la femme (WM4), suivi de tous les Questionnaires des enfants mis ensemble par ordre croissant selon le numro de ligne de
lenfant (UF4).

Le processus de saisie des donnes est guid par une application de CSPro appele entry.ent.
Cette application effectue deux taches principales. Premirement, pour un mnage donn, il
veille ce que tous les questionnaires (et seulement ces questionnaires) sont saisis et que toutes
les informations contenues dans ces questionnaires (et seulement ces informations) sont saisies.
Plus particulirement, lapplication de saisie des donnes commence par saisir toutes les donnes
du Questionnaire Mnage. Une fois que ces donnes ont t saisies, elle passe en revue la Feuille
dEnregistrement du Mnage et dtermine quels sont les membres du mnage qui sont ligibles
pour le Questionnaire Individuel Femme. Une fois quelle a identifi ces membres, lapplication
de saisie des donnes se positionne pour recevoir les donnes des questionnaires femmes lun
aprs lautre, en suivant un ordre ascendant selon le numro de ligne de la femme. Ensuite,
lapplication de saisie des donnes excute la mme procdure pour les membres du mnage qui

7.20

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

sont ligibles pour le questionnaire des enfants. Une fois que tous les questionnaires dun mnage ont t saisis, lensemble des donnes du mnage sont sauvegardes et lapplication passe
au mnage suivant dans la grappe, sil y en a.
Etant donn que les donnes ne sont sauvegardes que lorsque les questionnaires mnage, ceux
de toutes les femmes et de tous les enfants ligibles ont t saisis, les agents de saisie ne devraient pas quitter leurs machines alors quils sont au milieu de la saisie dun mnage. Avant de
prendre un temps de repos ou darrter le travail pour la journe, tous les questionnaires dun
mnage doivent tre compltement saisis. En outre, il est recommand, par prcaution, que les
donnes saisies sur le disque dur de lordinateur soient copies sur lordinateur du superviseur ou
sur une disquette. De plus, le superviseur doit copier chaque soir le contenu du rpertoire
c:\mics et de tous ses sous-rpertoires dans le priphrique de stockage secondaire. Cette prcaution permettra au superviseur de rcuprer les donnes si son ordinateur a une panne.
En plus du contrle sur le nombre de questionnaires qui sont saisis, lapplication de saisie des
donnes contrle de manire rigoureuse la structure des sauts lintrieur dun questionnaire.
Autrement dit, elle nattendra des rponses que pour les questions qui devaient tre poses, en
fonction des rponses aux questions prcdentes. Par exemple, si la valeur 2 est saisie pour la variable cm1 (cest--dire que la femme na jamais accouch), lapplication de saisie des donnes
sattendra ensuite ce que la valeur qui sera immdiatement saisie la suite sera celle de la variable ma1, sautant ainsi toutes les variables destines seulement aux femmes ayant accouches
La seconde tache de lapplication de saisie des donnes consiste minimiser les erreurs de saisie.
Pour ce faire, lapplication de saisie des donnes effectue des contrles au fur et mesure que les
donnes sont saisies. Si une valeur saisie est situe hors de lintervalle des valeurs du questionnaire, ou si toute autre incohrence simple est dtecte, lapplication de saisie des donnes affiche un message derreur et demande lagent de saisie de corriger lincohrence avant de poursuivre. Les corrections dincohrences plus complexes, qui retarderaient grandement la saisie des
donnes, ne sont pas faites lors de la saisie des donnes, mais plutt lors de lapurement secondaire des donnes.
MENU DE SAISIE DES DONNEES
Le menu de saisie des donnes simplifie lopration de saisie des donnes. Ce menu est cr par
lapplication de CSPro appele entry_menu.bch (il nest pas ncessaire de modifier cette application). Lillustration ci-dessous montre le menu de saisie des donnes.

TRAITEMENT DES DONNEES

7.21

Les options A, M et T ne sont utiliser que si lagent de saisie est entrain de saisir les donnes
dans le fichier primaire (fichier des donnes primaires). Les options R, U et V ne sont utiliser
que si lagent de saisie est entrain de procder la vrification des donnes (fichier des donnes
de vrification). Quant aux options N et Q, elles peuvent tre utilises en toute circonstance.
Loption A permet lagent de saisie dajouter des cas au fichier primaire de donnes, loption
M lui permet de modifier les cas dj enregistrs dans le fichier primaire de donnes, et loption
T lui permet de copier le fichier de donnes primaires complet dans une disquette, de sorte que
celui-ci puisse tre transfr sur lordinateur du superviseur. Loption R permet lagent de saisie dajouter des cas au fichier des donnes de vrification, loption U lui permet de modifier les
cas dj enregistrs dans le fichier de travail, et loption V lui permet de copier le fichier des
donnes de vrification complet dans une disquette, de sorte que celui-ci puisse tre transfr sur
lordinateur du superviseur.
Loption N permet lagent de saisie de modifier le numro de grappe, de faon pouvoir saisir
les donnes dune autre grappe. Loption Q permet de sortir du menu de saisie des donnes.
STRUCTURE DES REPERTOIRES SUR UN ORDINATEUR DE SAISIE DES DONNEES
Sur un ordinateur de saisie des donnes, tous les fichiers et programmes sont situs dans le rpertoire c:\mics\CSPro ou dans lun de ses sous-rpertoires. Les sous-rpertoires sont nomms data,
dicts, entry et veri. Le rpertoire data contient tous les fichiers des donnes primaires qui ont t
saisis sur cet ordinateur. Le rpertoire dicts contient tous les dictionnaires des donnes. Le rpertoire entry contient lapplication de saisie des donnes et lapplication qui cre le menu de saisie
des donnes. Le rpertoire veri contient tous les fichiers des donnes de vrification qui ont t
saisis sur cet ordinateur.

7.22

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES


La structure des rpertoires sur lordinateur de lagent de saisie est la suivante :

MICS
CSPRO
DATA
DICTS
ENTRY
VERI

Rpertoire
Rpertoire
Rpertoire
Rpertoire

des donnes primaires


des dictionnaires des donnes
de lapplication de saisie des donnes
des donnes de vrification

MENU DU SUPERVISEUR
Le menu du superviseur aide le superviseur du traitement des donnes grer le systme de traitement des donnes de la MICS3. Ce menu est lanc par lexcution de lapplication CSPro super_menu.pff. Pour sexcuter, le menu commence par demander le numro de grappe. Une fois
que le numro de grappe est saisi, lillustration ci-dessus affiche le menu du superviseur, suivi
par une prsentation rsume de chaque option.

OPTION T : SAISIE DES INFORMATIONS DE SUIVI DE LA GRAPPE


Cette option affiche la version lectronique du formulaire de suivi du traitement de la grappe, de
sorte que le superviseur du traitement des donnes puisse saisir les informations de suivi du traitement de la grappe. Des informations devraient tre saisies lorsque les questionnaires dune

TRAITEMENT DES DONNEES

7.23

grappe arrivent du terrain, lorsque la grappe est affecte un agent de saisie pour la saisie primaire des donnes, et lorsque la grappe est affecte un agent de saisie pour la saisie de vrification des donnes. Les autres informations de la version lectronique du formulaire sont mises
jour automatiquement au fur et mesure que le superviseur avance dans le menu du superviseur.
OPTION A : CONTROLE DE LA STRUCTURE DES DONNEES
Cette option vrifie la structure du fichier de donnes de la grappe, en excutant lapplication
check.bch. Aprs vrification de la structure du fichier de donnes, check.bch sort un fichier de
rsultat (qui saffiche automatiquement sur lcran) qui prsente de manire rsume le nombre
de chaque type de questionnaires et montre le nombre de questionnaires qui ont t remplis. Le
superviseur du traitement des donnes doit vrifier ces informations en les comparant avec celles
du formulaire de suivi du traitement des donnes, et sassurer que les deux sources saccordent.
Si ce nest pas le cas, le superviseur doit rechercher le problme (par exemple, lagent de saisie
aurait pu omettre de saisir un mnage) et le rsoudre en contrlant soigneusement les questionnaires de la grappe. Une fois le problme rsolu (en mettant jour soit le fichier de donnes, soit
le formulaire de suivi du traitement des donnes de la grappe), le superviseur du traitement doit
relancer le programme check.bch. Ce nest que lorsque check.bch produit le mme nombre de
questionnaires que celui du formulaire de suivi que le superviseur devra affecter les questionnaires un second agent de saisie pour des fins de vrification de la saisie des donnes.
OPTION B : VERIFICATION DES DONNEES
Cette option permet de comparer le fichier des donnes primaires dune grappe son fichier de
donnes de vrification en utilisant loutil de comparaison de CSPro. Si la moindre diffrence
entre les deux fichiers des donnes est dtecte, elle sera affiche sur lcran. Ce rsultat devrait
tre imprim et remis aux agents de saisie responsables de la saisie des donnes de cette grappe.
En travaillant en quipe de deux, les agents de saisie devront revoir les questionnaires et dterminer la valeur correcte pour chacun des cas o les deux fichiers de donnes diffrent. Une fois
quils auront dtermin les valeurs correctes, chaque agent de saisie devra mettre jour son fichier de donnes. Cela fait, les deux fichiers devront de nouveau tre compars. Sil ny a plus de
diffrence entre les fichiers, le traitement des donnes de la grappe peut se poursuivre.
OPTION C : ARCHIVAGE DES DONNEES BRUTES
Cette option archive les donnes brutes en copiant le fichier des donnes primaires dans le sousrpertoire back-up de lordinateur du superviseur. Cette option doit tre lance aprs que les
contrles et les vrifications de structures auront t termins, et avant quaucun apurement secondaire ne soit effectu. Les donnes brutes sont archives pour documenter ltat des donnes
avant leur apurement.

7.24

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

OPTION D : EXECUTER UN SECOND PROGRAMME DE CONTROLE


Cette option vrifie les incohrences plus complexes en excutant lapplication editing.bch. Le
rsultat de ce programme saffiche sur lcran, et il devrait tre imprim sil contient des messages derreurs. Si cest le cas, la liste des incohrences et les questionnaires de la grappe devraient
tre remis un agent de vrification. Lagent de vrification, sur la base de ses connaissances du
questionnaire et du manuel dapurement des donnes en Annexe Sept, devra rsoudre chacune
des incohrences listes. Lorsque les agents de vrification auront achev leur travail, ils rendront la liste des incohrences et des actions requises au superviseur du traitement des donnes,
qui aura mettre en uvre personnellement les modifications requises (voir Option E cidessous). Cela fait, le superviseur relance editing.bch. Sil ny a plus de message derreur, le traitement des donnes peut se poursuivre ; par contre, si des messages derreurs demeurent, une
liste de ces messages et les questionnaires devraient tre remis lagent de vrification pour un
contrle plus approfondi. Dans certains cas, les messages seront considrs comme acceptables
par lagent de vrification, et il ne sera pas ncessaire daller plus loin dans la correction des
donnes. Si les seuls messages qui continuent safficher sont ceux derreurs que lagent de vrification trouve acceptables, alors on peut considrer le processus dapurement secondaire des
donnes comme termin.
OPTION E. MODIFICATION DES DONNEES
Cette option excute lapplication entry.ent qui permet au superviseur du traitement des donnes
de mettre en uvre les modifications requises par les agents de vrification. Aprs avoir utilis
cette option, le superviseur devra retourner lOption D pour sassurer que les modifications
dans les donnes ont effectivement permis de corriger les incohrences comme souhait, et
quaucune nouvelle incohrence na t introduite.
OPTION F. ARCHIVAGE DES DONNEES APUREES
Cette option copie le fichier des donnes apures dans le sous-rpertoire final de lordinateur du
superviseur du traitement des donnes. Les donnes stockes dans ce rpertoire seront par la
suite concatnes, puis exportes vers SPSS.
OPTION G. EXPORTATION DES DONNEES VERS SPSS
Cette option concatne tous les fichiers de donnes du rpertoire final en un seul fichier, qui est
ensuite export par lexcution de lapplication export.bch. Cette application cre 4 fichiers textes ASCII et le fichier de syntaxe SPSS correspondant pour chacun de ces fichiers textes. Lun
des fichiers textes contient les mnages, lautre contient les membres des mnages, le troisime
contient les femmes et le dernier contient les enfants.

TRAITEMENT DES DONNEES

7.25

OPTION H. SAISIE DES DONNEES DU SYSTEME DE POSITIONNEMENT GEOGRAPHIQUE (GPS)


Cette option permet au superviseur du traitement des donnes de saisir les donnes de localisation GPS en excutant lapplication gpsentry.ent. Contrairement au programme de saisie des
donnes primaires, cette application permet au superviseur du traitement des donnes de saisir
autant de grappes en mme temps quil le dsire. Comme mesure de prvention des erreurs de
saisie, lapplication exige du superviseur que les donnes GPS soient saisies deux fois.
OPTION I. MODIFICATION DES DONNEES GPS
Cette option permet au superviseur du traitement des donnes de modifier les donnes de localisation GPS en lanant lapplication gpsentry.ent.
OPTION V. AFFICHAGE DES INFORMATIONS DE SUIVI DE LA GRAPPE
Cette option affiche, pour toutes les grappes, les informations contenues sur le formulaire de suivi du traitement de la grappe.
OPTION N. SELECTIONNER UNE NOUVELLE GRAPPE
Cette option change le numro de la grappe, de sorte que le superviseur du traitement peut passer
au traitement dune nouvelle grappe.
STRUCTURE DU REPERTOIRE
SUPERVISEUR

SUR LORDINATEUR DE

TRAITEMENT

DES

DONNEES

DU

Le systme de traitement des donnes de la MICS3 utilise une structure de rpertoire spcifique
sur les ordinateurs des agents de saisie et sur lordinateur du superviseur de traitement des donnes. La structure des ordinateurs de saisie des donnes est prsente ci-dessous. Sur lordinateur
du superviseur, tous les fichiers et programmes relatifs SPSS sont stocks dans le rpertoire
c:\mics\spss ou dans lun de ses sous-rpertoires. Sur lordinateur du superviseur, tous les fichiers et programmes relatifs CSPro sont stocks dans le rpertoire c:\mics\CSPro ou dans lun
de ses sous-rpertoires. Les sous-rpertoires sont dnomms backup, dicts, entry, export, gps, final, raw, super et weights.

7.26

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES


La structure des rpertoires de lordinateur du superviseur est la suivante :

MICS
CSPRO
BACKUP
DICTS
ENTRY
EXPORT
FINAL
GPS
RAW
SUPER
WEIGHTS

Rpertoire
Rpertoire
Rpertoire
Rpertoire
Rpertoire
Rpertoire
Rpertoire
Rpertoire
Rpertoire

Back-up
des dictionnaires des donnes
de lapplication de saisie des donnes
de lapplication Export
des donnes apures
de lapplication de saisie des donnes GPS
des donnes brutes
de lapplication de contrle du superviseur
de lapplication des poids de lchantillon

Le rpertoire back-up contient des copies de sauvegarde des fichiers de donnes dont la structure
a t contrle et qui ont t vrifis, mais non apurs. Le rpertoire dicts contient tous les dictionnaires de donnes. Le rpertoire entry contient lapplication de saisie des donnes, ainsi que
lapplication qui cre le menu de saisie des donnes. Le rpertoire export contient les programmes qui permettent dexporter les donnes de CSPro vers SPSS. Le rpertoire final contient des
copies de sauvegarde des fichiers de donnes dont la structure a t contrle, qui ont t vrifis
et apurs. Le rpertoire raw contient les fichiers de donnes qui ont t transfrs des ordinateurs
des agents de saisie. Le rpertoire super contient les applications qui effectuent les contrles de
structure, la vrification et lapurement secondaire, ainsi que lapplication qui cre le menu du
superviseur. Le rpertoire weights contient la feuille de calcul qui permet de calculer les poids de
lchantillon.

CONTROLE DE STRUCTURE
Il est crucial que les donnes soient structurellement solides. Le programme de saisie des donnes met en application la plupart des cohrences structurelles, mais il ne peut tout vrifier sans
tre extrmement contraignant. Par consquent, il est ncessaire dexcuter un programme de
contrle de structure une fois que la saisie des donnes est termine. Le programme de contrle
de structure sassure que le nombre de questionnaires figurant dans le fichier de donnes correspond au nombre de questionnaires rceptionns du terrain, et il effectue quelques contrles supplmentaires sur la structure dun questionnaire individuel.
Le programme de contrle de structure est dnomm check.bch. Cette section met davantage
laccent sur ce que le programme peut faire, plutt que sur la manire dont il le fait. Le programme est complexe et il ne se prte pas des explications faciles. La meilleure manire de
comprendre la logique du programme est de ltudier attentivement, une fois que vous avez
compris ce que le programme est susceptible de faire. Un exemple des rsultats majeurs issus de
check.bch est montr ci-dessous.

TRAITEMENT DES DONNEES

7.27

MICS Data Structure Check


Cluster: 3
Households |
Women
Total Comp Incomp | Eligible
Interviewed
| HH12 FOUND HH13 FOUND
2
1
1
|
5
5
4
4

|
Children
| Eligible Interviewed
| HH14 FOUND HH15 FOUND
|
4
4
3
3

Le premier bloc de rsultats est un rsum du nombre total de mnages et de leurs codes de rponses. Le second bloc de rsultats prsente les rsultats de quatre dcomptes du nombre de
femmes ligibles. Les dcomptes des colonnes hh12 et hh13 reprsentent les nombres de femmes
ligibles et interviewes selon le Panneau dInformation du Mnage. Les dcomptes dans les colonnes found reprsentent les nombres de questionnaires femmes et de questionnaires femmes
remplis, respectivement, dans le fichier de donnes.
Le troisime bloc de rsultats prsente les rsultats de quatre dcomptes du nombre denfants de
moins de cinq ans ligibles. Les dcomptes des colonnes hh14 et hh15 reprsentent les nombres
denfants ligibles et interviews selon le Panneau dInformation du Mnage. Les dcomptes
dans les colonnes found (cest--dire trouv) reprsentent les nombres de questionnaires
denfants et de questionnaires denfants remplis, respectivement, dans le fichier de donnes.
Le rsultat de check.bch devrait tre imprim par le superviseur, et les informations contenues
devraient tre compares au formulaire de suivi du traitement de la grappe. Si une diffrence est
constate entre les eux dcomptes de questionnaires, le superviseur et lagent de saisie devront se
servir du listing des erreurs et des questionnaires de la grappe pour identifier la cause du problme de structure. Lorsque ces causes auront t identifies, elles devront tre corriges par
lagent de saisie. Lapplication de vrification de la structure devra alors tre excute de nouveau, afin de sassurer que le problme a bien t rgl sans en crer un nouveau. Ce ne sera que
lorsque les dcomptes gnrs par check.bch correspondent ceux du formulaire de suivi du traitement de la grappe que la saisie des donnes de vrification pourra commencer.
Lapplication check.bch produit une liste de tous les mnages de la grappe. Chacun des numros
de mnage et des codes de rsultat est affich, en mme temps que le dcompte des questionnaires de femmes et denfants ligibles, si linterview du mnage a t remplie (cest--dire, le code
de rsultat du mnage est gal 1). Un exemple de rsultat dun mnage est donn ci-dessous.
MICS Data Structure Check
Household: 1
Result:
1
Women
Eligible Interviewed
HH12 FOUND HH13 FOUND
4
4
3
3

|
Children
| Eligible Interviewed
| HH14 FOUND HH15 FOUND
|
2
2
1
1

Le listing des mnages peut tre dune grande utilit pour lidentification de la source du problme au niveau de la grappe. Supposons, par exemple, que la feuille de suivi du traitement de la
grappe liste 20 mnages dans la grappe, mais que seuls 19 sont retrouvs dans le fichier de don-

7.28

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

nes. En comparant le listing des mnages aux questionnaires de la grappe, on peut aisment retrouver le mnage qui na pas t saisi.

VERIFICATION
La vrification des donnes ayant fait lobjet dune double saisie est effectue par une application de comparaison de CSPro. Cette application de comparaison est dnomme compare.cmp.
Elle contient une liste de toutes les variables (items). Tel que le programme est actuellement
configur, les items cochs seront compars lors de la vrification et les items non cochs ne seront pas compars au cours de la vrification. Une seule variable nest pas coche (le code de
lagent de saisie, hh16), et il est conseill quaucune autre variable ne soit non coche puisque
des diffrences sur toutes ces autres variables sont susceptibles de compromettre la qualit des
donnes.
Lapplication de comparaison compare le fichier des donnes primaires (qui a t copi sur la
machine du superviseur) et le fichier des donnes de vrification (qui a t copi sur une disquette, ou sur un serveur, dans le cas o un rseau est utilis), et il ressort une liste des diffrences, sil y en a. si aucune diffrence nexiste, le superviseur devrait archiver les donnes brutes,
puis passer lapurement secondaire des donnes.
Si des diffrences existent, la liste de celles-ci devrait tre imprime et remise aux deux agents
de saisie. Les agents de saisie devront alors se servir de la liste des diffrences et des questionnaires de la grappe pour contrler chacune des diffrences releves, et inscrire sur la liste les fichiers qui devront tre corrigs. Lorsque toutes les diffrences auront t examines, les agents
de saisie devront corriger toutes les erreurs de leurs fichiers. Ensuite, ils devront recopier les fichiers de donnes sur leurs disquettes (ou sur le serveur), et les fichiers seront compars de nouveau. Ce processus se poursuivra jusqu ce que les deux fichiers soient identiques.

APUREMENT SECONDAIRE
Lexprience a montr que les incohrences simples peuvent tre facilement identifies et corriges pendant la saisie des donnes. Mais les incohrences plus complexes devraient tre rsolues
travers un examen mticuleux du questionnaire. La meilleure manire de procder ce type de
vrification des incohrences est den faire une tape distincte, avec les erreurs transcrites sur un
document imprim qui peut tre utilis pour marquer les corrections. Cette tape est connue sous
le nom dapurement secondaire.
Le programme dapurement secondaire est dnomm editing.bch. Il sacquitte dune longue liste
de contrles de cohrences (par exemple, est ce que les ges et les dates de naissance sont cohrents ?) et produit une liste des incohrences dtectes dans le fichier de donnes primaires. Le
superviseur du traitement des donnes devra imprimer cette liste et la remettre, accompagne des

TRAITEMENT DES DONNEES

7.29

questionnaires de la grappe, aux agents de vrification. Lagent de vrification procde alors


une revue de la liste des erreurs et des rponses du questionnaire. En utilisant les directives
dapurement des donnes (qui se trouvent dans lAnnexe Sept) et sur la base de sa maitrise du
questionnaire, lagent de vrification aura alors, soit rdiger sur le listing des erreurs la correction effectuer, soit crire quil ny a aucune action prendre. Lorsque lagent de vrification
aura pass en revue tous les messages derreurs, lun aprs lautre, il devra remettre le listing
derreurs annot au superviseur du traitement des donnes. Ce dernier aura alors intgrer les
modifications proposes dans les donnes brutes. Une fois cela fait, le superviseur du traitement
des donnes relance le programme dapurement. Ce nest que lorsque le programme dapurement
ne produit plus de message derreur que le traitement de la grappe peut continuer.
Trois aspects du processus dapurement des donnes revtent une importante cruciale. Premirement, pour chaque erreur affiche, lagent de vrification devra retourner au questionnaire
concern et lexaminer attentivement. En second lieu, lagent de vrification doit se rfrer aux
directives dapurement avant de proposer une solution au problme. Troisimement, le processus
dapurement des donnes devra tre rpt autant de fois que ncessaire, jusqu limination de
toutes les erreurs.
Une fois que cette troisime tache est acheve, le superviseur du traitement des donnes peut archiver les donnes apures. Ces donnes peuvent maintenant tre considres comme propres, et
elles peuvent tre utilises pour la cration des fichiers danalyse.

EXPORTATION DES DONNEES VERS SPSS


Lorsque le traitement des donnes primaires est termin, vous avez en votre possession un fichier
de donnes propre pour chacune des grappes de votre chantillon. Alors que le traitement des
donnes primaires est effectu avec CSPro, le traitement secondaire des donnes est essentiellement effectu avec SPSS. La premire tape du traitement secondaire des donnes consiste donc
convertir les donnes du format CSPro au format SPSS. Cela est fait en utilisant loption Export the data to SPSS3 du menu du superviseur.
Lorsque vous slectionnez cette option, tous les fichiers de donnes du sous-rpertoire final (autrement dit, tous les fichiers de donnes qui ont t vrifis, contrls et apurs) sont concatns
en un seul fichier dnomm all.dat. Ce fichier de donnes est ensuite export vers SPSS par
lapplication export.bch. Cette application cre quatre fichiers de donnes ASCII (mych.dat,
myhh.dat, myhl.dat et mywm.dat) et quatre fichiers de syntaxe SPSS (mych.sps, myhh.sps,
myhl.sps et mywm.sps) dans le rpertoire c:\mics\spss. Lorsque les fichiers de syntaxe SPSS liront les fichiers de donnes ASCII dans SPSS, ils ne les sauvegarderont pas. Si lon veut que les
fichiers de syntaxe sauvent les donnes sous le format SPSS, la commande SPSS
3

Exporter les donnes vers SPSS.

7.30

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

save outfile = `filename.sav.

doit tre ajoute la fin de chaque fichier de syntaxe. Le mot filename devrait tre remplac par
hh, hl, wm ou ch, selon le type du fichier de donnes. Une fois que cette commande aura t correctement modifie et ajoute chacun des fichiers de syntaxe, lexcution des fichiers de syntaxe SPSS permettra la cration des fichiers de donnes SPSS hh.sav, hl.sav, wm.sav et ch.sav.

CREATION DUN FICHIER DANALYSE


La structure du fichier de donnes lors du traitement des donnes primaires simplifie le processus
de saisie des donnes. Toutefois, cette structure nest pas optimale pour lanalyse des donnes
collectes et cest la raison pour laquelle la premire tache excuter aprs que les donnes ont
t transfres vers SPSS consiste recoder les variables, pour faciliter lanalyse et la rendre plus
efficace. Cette tache est connue sous le nom de cration dun fichier danalyse. Cette section prsente en dtail les tapes de la cration des fichiers danalyse de la MICS3. Les fichiers
danalyse qui rsulteront de lapplication de ces tapes peuvent tre utiliss par les plans de tabulation modles et peuvent tout fait tre dissmins auprs de chercheurs.
RECODIFICATION DES VARIABLES
Les programmes makehl.sps, makewm.sps et makech.sps recodent les variables existantes pour
en crer de nouvelles. Les variables qui sont utilises dans plusieurs tabulations sont recodes
dans ces programmes avant dtre sauves ; toutes les autres recodifications sont effectues dans
les programmes de tabulation et sont temporaires.
La recodification de la plupart des variables utilise les commandes standards de SPSS, et ne sera
donc pas prsente ici. Toutefois, il y a une approche couramment utilise qui doit tre explique : la recodification des variables en 0 ou 100. Cette recodification inhabituelle nest faite
qu des fins dillustration. Lorsque SPSS affiche des pourcentages dans un tableau, il affiche
toutes les catgories possibles de la variable. Pour plusieurs tableaux du plan de tabulation, ce
nest quune seule catgorie qui nous intresse. Si nous affectons la valeur 100 cette catgorie
et la valeur 0 toutes les autres catgories, la moyenne de cette variable est la proportion de personnes enqutes dans cette catgorie. Ainsi, le fait de demander SPSS dafficher la moyenne
de cette nouvelle variable aura comme rsultat de nafficher que le pourcentage qui nous intresse.
Par exemple, la variable ha1 enregistre le fait pour une femme davoir entendu parler ou non du
SIDA. Elle prend la valeur 1 dans le cas o la femme a dj entendu parler du SIDA, et la valeur
0 dans le cas contraire. Si nous voulons afficher le pourcentage de femmes ayant dj entendu
parler du SIDA dans le programme makewm.sps, la variable ha1 est recode dans la variable
aids. La variable aids prend la valeur 100 dans le cas o la femme a dj entendu parler du

TRAITEMENT DES DONNEES

7.31

SIDA, et la valeur 0 sinon. Pour comprendre pourquoi il en est ainsi, regardez lexemple cidessous :
Femmes ayant entendu parler du SIDA
Nombre total de femmes
Pourcentage de femmes ayant entendu parler
du SIDA
Moyenne de la variable aids

10
20
10 / 20 x 100 = 50
(10 x 100 + 10 x 0)/20 = 10 x 100/20 = 10/20 x 100 = 50

CALCUL ET AJOUT DES POIDS DECHANTILLON


Si des bases de sondage distinctes ont t utilises pour diffrentes rgions (ou domaines) pour le
tirage au premier degr, lchantillon national na pas t choisi avec probabilit proportionnelle
la taille. Cela peut galement se produire si vous avez procd une stratification selon certains autres facteurs (par exemple, urbain/rural ou quartiers pauvres/autres quartiers) et utilis
des taux de sondage (proportions) diffrents dans chaque strate. Ces chantillons ne sont pas
auto-pondrs, et vous devez pondrer votre chantillon quand vous calculez les estimations nationales. Cela signifie que vous devez vous assurer que la part de chaque sous-chantillon distinct par exemple, chaque rgion (domaine) contribue lchantillon national seulement pour
la part quil aurait eu si lchantillon de lenqute, au niveau national, avait t tir avec une probabilit proportionnelle la taille.
Si votre chantillon nest pas auto-pondr, vous devez calculer les poids dchantillon et les
ajouter vos fichiers danalyse. Cette tache est ralise en utilisant la feuille de calcul weights.xls et les programmes SPSS weights_table.sps, et weights_merge.sps. La feuille de calcul est
utilise pour calculer les poids de lchantillon. Elle comporte deux feuilles de travail, calculations et output. La feuille de travail calculations excute les calculs. Quant la feuille de travail
output, elle ne contient que les poids de lchantillon et une liste des numros de grappes ; ce format est dune grande utilit pour la lecture des donnes dans SPSS. Le programme weights_table.sps produit les donnes requises pour le calcul des poids de lchantillon. Le programme
weights_merge.sps ajoute les poids de lchantillon appropris aux fichiers danalyse. Le programme weights.sps, que vous naurez jamais excuter directement, dcrit la structure des donnes dans la feuille de travail de sortie des rsultats.
La procdure de calcul des poids de lchantillon et de leur ajout vos fichiers danalyse peut
tre subdivise en sept tapes :
Etape 1 : Ajustez le nombre de lignes des feuilles de travail calculations et output, de sorte quil
ny ait quune seule ligne par grappe de votre enqute. Une fois que vous aurez fini de supprimer
ou dajouter des lignes, veillez vrifier que cette opration na pas modifie le nombre total de
lignes de la feuille de travail calculations.

7.32

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

Etape 2 : Saisissez les poids qui ont t construits dans le plan de sondage dans la feuille weights.xls. Si vos poids sont variables entre les grappes dune strate ou dun domaine particulier, il
vous faudra remplir la fois la colonne des indices de pondration au niveau grappe et la colonne des indices de pondration au niveau strate (ou domaine), cela partir des informations qui
vous seront fournies par votre spcialiste en sondage. Si vos poids sont variables entre les strates
(ou domaines), mais ne le sont pas entre les grappes au sein dune strate (autrement dit,
lchantillon est auto-pondr lintrieur des strates ou domaines), saisissez la valeur 1 dans la
colonne des indices de pondration au niveau grappe et remplissez la colonne des indices de
pondration au niveau strate (ou domaine) en vous servant des informations qui vous seront
fournies par votre spcialiste en sondage.
Etape 3 : Procdez une mise jour de la dfinition des strates (ou domaines) sur les lignes 3
10 du programme weights_table.sps. Les programmes standards supposent que les strates sont
formes par les combinaisons de toutes les zones (cest--dire urbain et rural) et rgions, et quil
y a quatre rgions (le programme devrait tre modifi pour reflter les strates ou domaines qui
sont utiliss dans votre chantillon).
Etape 4 : Excutez le programme weights_table.sps.
Etape 5 : Copiez les informations du tableau et collez les dans la feuille de travail calculations
de weights.xls. Lorsque cette tape sera termine, weights.xls calculera automatiquement les
poids de sondage de lchantillon.
Etape 6 : Sauvegardez votre feuille de travail output sous la forme dun fichier spar par un
point (*.csv), sous le nom weights.csv dans le rpertoire c:\mics\weights.
Etape 7 : Excutez le programme weights_merge.sps. Une fois que vous aurez achev la septime tape, pensez vrifier la feuille de sortie des rsultats pour voir si elle comporte des messages derreurs, et ouvrez les fichiers danalyse pour vous assurer que les poids ont t correctement ajouts aux fichiers de donnes SPSS.
CALCUL ET AJOUT DE LINDICE DE RICHESSE
Parmi les variables socio-conomiques utilises, le plan de tabulation de la MICS3 inclut lindice
de richesse (encore appel indice de bien-tre conomique). Cet indice de richesse est calcul par
le programme wealth.sps qui cre le fichier de donnes wealth.sav contenant les variables
didentification, une variable contenant le score de richesse de chaque mnage et une variable
contenant lindice de richesse de chaque mnage. En premier lieu, le programme wealth.sps sort
des frquences de toutes les variables du mnage qui concernent la richesse ou les biens possds. Ensuite, il recode les variables dcrivant les biens du mnage ou de lindividu, transformant
ces variables en variables dichotomiques. Puis le programme utilise lanalyse factorielle (plus
prcisment lanalyse en composantes principales) pour calculer un score de richesse pour chaque mnage. Pour terminer, il utilise le score de richesse pour crer les quintiles de richesse

TRAITEMENT DES DONNEES

7.33

(cest--dire lindice de bien tre conomique) quil sauvegarde dans un fichier de donnes
SPSS. Le choix des variables prendre en compte dans lanalyse factorielle est crucial, et ne devrait tre fait quaprs un examen minutieux des frquences produites. Les informations sur les
variables incluses dans lanalyse sont disponibles sur le site Web www.childinfo.org. Une fois
que lindice de richesse aura t calcul, lexcution du programme wealth_merge.sps
ladjoindra vos fichiers danalyse. Pensez vrifier la feuille de sortie des rsultats pour voir si
elle comporte des messages derreurs, et ouvrez les fichiers danalyse pour vous assurer que les
valeurs de lindice de richesse ont t correctement ajoutes aux fichiers de donnes SPSS.
AJOUT DES COORDONNEES GPS
Certaines enqutes MICS3 recueilleront les coordonnes GPS de leurs grappes lors du travail de
terrain. Ces coordonnes GPS, qui donnent la localisation prcise des grappes, peuvent tre utilises pour adjoindre une srie de donnes gographiques (par exemple des donnes pluviomtriques) une srie de donnes MICS3. Si votre enqute recueille des coordonnes GPS, vous voudriez probablement les intgrer vos fichiers danalyse. Cette tache est ralise par deux programmes SPSS : gps.sps et gps_merge.sps. Le programme gps.sps, que vous naurez jamais
excuter directement, dcrit la structure du fichier de donnes gps.dat (qui est cr par
lapplication de saisie des donnes de CSPro gpsentry.bch). Si vous avez modifi le dictionnaire
CSPro gps.dic, vous devriez mettre jour gps.sps pour prendre en compte vos modifications. Le
programme gps_merge.sps adjoint les coordonnes GPS aux fichiers danalyse. Vous navez pas
besoin de modifier ce programme. Pour adjoindre les coordonnes GPS vos fichiers danalyse,
excutez gps_merge.sps. Pensez vrifier la feuille de sortie des rsultats pour voir si elle comporte des messages derreurs, et ouvrez les fichiers danalyse pour vous assurez que les coordonnes GPS ont t correctement ajoutes aux fichiers de donnes SPSS.

PREPARATION DE LA TABULATION
Le Chapitre 8 dcrit en dtail le processus danalyse des donnes et de prparation des rapports.
Faire tourner les tableaux est une composante importante de cette activit. Un plan de tabulation
modle (Chapitre 8 et Annexe Six) et un programme de tabulation pour SPSS sont joints ce
manuel. Il est prvu un programme de tabulation SPSS pour chaque table dans le plan de tabulation de la MICS3. Chaque nom de programme est compos de la lettre t suivie du numro du
tableau dans le plan de tabulation. Par exemple, le programme t1.sps cre le Tableau 1 du plan de
tabulation.
Avant de faire tourner les tableaux pour le rapport, il est essentiel de produire une srie de distributions de frquences (non pondres) pour chaque variable dans le fichier des donnes. Les frquences doivent tre vrifies pour y reprer les valeurs anormales, celles qui sont en dehors de
ltendue de la plupart des rponses et celles qui semblent tre des rponses invraisemblables
des questions qui se rapportent lenqute. Par exemple, une rponse de 53 la question sur le
nombre dheures de travail effectu par un enfant au cours de la dernire semaine semble la

7.34

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

fois invraisemblablement leve et trop prcise. Les informations didentification de tels cas doivent tre crites, et les questionnaires concerns devraient tre vrifis par rapport aux valeurs
contenues dans le fichier des donnes.
REVISION DES PROGRAMMES MODELES
Chaque programme de tabulation devrait tre examin avec soin. Il est important de vrifier que
les variables utilises dans le programme de tabulation figurent bien dans votre fichier de donnes. Si ce nest pas le cas, vrifiez si cette variable est de premire importance, ou plutt a une
importance secondaire. Sil sagit dune variable de premire importance, qui ne figure pas dans
votre fichier de donnes, vous devrez, soit liminer le tableau compltement, soit demander un
analyste de revoir la conception du tableau. Par contre, si cest une variable dimportance secondaire qui est manquante, liminez toutes les rfrences cette variable dans votre programme
de tabulation et faites tous les ajustements quimplique son retrait du programme.
Toute opration de recodification devrait tre mene avec beaucoup de soin. Si votre questionnaire comporte des variables ayant des catgories non-standards, toute opration de recodification impliquant ces variables devrait tre examine. Si votre questionnaire comporte des variables non-standards, elles devraient faire lobjet dune recodification sil est prvu de les utiliser
dans une tabulation.
Il vous faudra aussi contrler minutieusement toute opration dadjonction, si votre questionnaire
utilise des identifiants qui ne figurent pas dans le questionnaire standard. Plusieurs adjonctions
figurant dans les programmes de tabulation ne marcheront que si des identifiants uniques sont
utiliss.
ADJONCTION DES POIDS DE LECHANTILLON
La pondration dans les programmes de tabulation est simple, sauf dans les cas o la commande
SPSS aggregate est concerne. Si le but de la commande aggregate est de faire un cumul des cas
pour calculer un numrateur et un dnominateur, les poids devraient tre ajouts avant
lexcution de la commande aggregate. Ils ne devraient pas tre utiliss lorsque lon travaillera
avec le fichier qui en rsultera ; ce fichier tant dj pondr.
Par exemple, le Tableau HH.1, montr dans lAnnexe Sept, contient le taux de rponses des mnages. Le taux de rponse des mnages est difficile calculer, car il ncessite de diviser une variable par une autre lintrieur du tableau. Une des solutions ce problme consiste crer un
fichier agrg qui contient le dcompte des mnages chantillonns, des mnages occups et des
mnages interviews. Le fichier agrg contient un cas pour chaque catgorie de la variable discriminante concerne (par exemple, urbain/rural).
Les poids devraient tre adjoints lorsque le fichier agrg est cr pour gnrer le numrateur
pondr (le dcompte des mnages interviews) et le dnominateur pondr (le dcompte des

TRAITEMENT DES DONNEES

7.35

mnages occups). Une fois que le fichier agrg aura t cr, le taux de rponses des mnages
pour chaque catgorie de la variable discriminante est le numrateur divis par le dnominateur.
Si le but de la commande aggregate est de crer un rsum des statistiques des cas individuels,
les poids devraient tre adjoints aprs la commande aggregate. Par exemple, le Tableau HH.3 de
lAnnexe Sept contient des informations sur le pourcentage de mnages abritant au moins un enfant de moins de 15 ans. Cette information ne figure pas dans le fichier de donnes mnage, mais
il peut tre cr en agrgeant le fichier dnumration du mnage. Les variables discriminantes
sont le numro de grappe et le numro de mnage. Les poids sont adjoints aprs agrgation,
parce que ce qui nous intresse, cest le pourcentage pondr de mnages avec au moins un enfant de moins de 15 ans, et non le nombre pondr denfants de moins de 15 ans dans chaque
mnage.
LA COMMANDE INCLUDE
Le programme SPSS tables.sps excutera tous les programmes de tabulation en une seule fois. Il
consiste en une suite de la commande SPSS include, qui excutent les programmes de tabulation
de manire individuelle. Si SPSS rencontre une erreur dans lun des programmes qui sont inclus
(autrement dit, excuts par une commande include), il arrtera immdiatement lexcution du
programme et retournera au programme qui inclut le programme (cest--dire le programme qui
contient la commande include).
Pour cette raison, tables.sps ne devrait tre utilis quune fois que tous les fichiers individuels de
tabulation auront t contrls, modifis et tests. Assurez-vous dliminer la commande include
qui excute un programme de tabulation que vous nutilisez pas.
La commande include impose quatre contraintes aux programmes quelle excute. La premire
contrainte est que chaque commande doit commencer dans la premire colonne du programme. Il
ressort de cette contrainte quelle limite le retrait du programme, alors quune ligne devrait
compter un retrait si elle commence par le caractre +. La commande qui suit illustre
lutilisation du caractre +.
do if (cage >= 6 and cage <= 9).
+ compute solids = 0.
+ if (BF3G = 1) solids = 100.
end if.
variable labels solids "Solid foods".

La seconde contrainte impose par la commande include est que si cette commande se poursuit
sur plusieurs lignes, la colonne 1 des lignes de continuation devrait rester vide. Lexemple cidessous illustre une commande multi-ligne qui respecte cette contrainte.
add files
/file=*
/file='tmp6.sav'.

7.36

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

Notez que les sous-commandes sur les 2me et 3me lignes ont un retrait de deux colonnes (alors
quelles navaient besoin davoir un retrait dune colonne pour respecter la contrainte, elles ont
eu un retrait de deux colonnes pour tre en conformit avec le style de programmation de la
MICS3).
Les troisime et quatrime contraintes imposes par la commande include sont que les commandes de fin de programmation sont optionnelles et quun astrisque (*) dans la premire colonne
dune ligne indique que celle-ci est une ligne de commentaire. Aucune de ces contraintes na
dincidence sur nos programmes de tabulation.
En plus de tables.sps, il existe un programme SPSS qui rend automatique la cration de fichiers
danalyse. Ce programme sappelle CSPro.sps. Ce programme ne devrait tre utilis quaprs
que chacun des programmes qui le composent aura t excut et les rsultats affichs. Cela garantit que tous les programmes de cration de fichier danalyse seront excuts dans le bon ordre.

ARCHIVAGE ET DISTRIBUTION DES DONNEES


Une composante importante, mais souvent nglige du traitement et de lanalyse de lenqute est
larchivage et la documentation des fichiers de donnes. En plus du fait que les fichiers des donnes sont largement disponibles ou bien limits une seule institution, il est trs utile dtablir
bien lavance quelques directives de distribution. Ces tapes, archivage - documentation et distribution du fichier des donnes, exigent un investissement en temps et en efforts. Toutefois, cet
investissement en vaut la peine, et ce, pour plusieurs raisons :
Cela permet daugmenter le cot-efficacit de la collecte des donnes. Recueillir les
donnes dune enqute est une activit coteuse et demande un travail intense. Afin de justifier cet investissement, les donnes recueillies doivent tre exploites de la manire la plus
exhaustive possible. Rendre les fichiers des donnes accesssibles dautres chercheurs augmente le cot-efficacit de lactivit de lenqute.
Il permet daugmenter, au niveau national, lappropriation des donnes et
lacceptation des rsultats de lenqute. Quand le fichier des donnes peut tre utilis par
dautres, le processus de collecte des donnes gagne en crdibilit. Les responsables de la collecte des donnes sont perus comme ayant confiance en leurs rsultats, et laccessibilit au
fichier des donnes par les autres chercheurs signifie que les mmes rsultats peuvent tre reproduits et vrifis par dautres personnes.
Il permet dexaminer les tendances. Les rsultats publis partir de diffrentes enqutes
ne sont pas, souvent, directement comparables. Par exemple, le rapport dune enqute antrieure peut dfinir les enquts adultes comme ceux gs de 15 ans ou plus, alors quune autre
dfinirait les adultes comme ceux gs de 18 ans ou plus. Sans les fichiers des donnes, le
mieux que lon puisse faire cest davoir une comparaison imprcise des deux sries de rsul-

TRAITEMENT DES DONNEES

7.37

tats. Par contre, lorsque les fichiers de donnes des deux enqutes sont disponibles, les rsultats peuvent souvent tre re-tabuls, de telle sorte quils deviennent directement comparables,
ce qui permet de tirer des conclusions valables sur les tendances.
Il permet de faire des comparaisons intra-pays et inter-pays. Il est souvent instructif
de comparer les rsultats entre pays, ou bien au sein dune sous-rgion ou entre rgions. Ces
comparaisons facilitent lidentification des zones o on a besoin dattirer lattention sur un
programme particulier, ou dans lesquelles des programmes ont t particulirement russis.
En plus, il peut tre utile de comparer les rsultats provenant de diffrentes enqutes dans un
mme pays. Quelquefois, cela est fait pour valider des rsultats inattendus (par exemple, un
niveau de mortalit infantile plus faible que prvu) ou pour valuer les effets dune mthodologie particulire de collecte des donnes (par exemple, le fait de se baser sur les cartes de
vaccination par rapport au fait de recueillir les dclarations des mres sur les vaccinations).
Afin dentreprendre ce type danalyses, les chercheurs doivent pouvoir accder aux fichiers
des donnes, de telle sorte que des chiffres directement comparables puissent tre calculs.
Il permet lanalyse approfondie des domaines dtudes importants, par des spcialistes en la matire. En raison de la pression sur les responsables de lenqute de prsenter rapidement les rsultats, les informations souvent fournies dans un rapport denqute comprennent seulement les rsultats de base de cette enqute. Un fichier des donnes bien document
et disponible permettra dentreprendre des analyses approfondies sur des domaines dtudes
particuliers ; et ces analyses peuvent tre excutes par des spcialistes en la matire qui peuvent ne pas faire partie du personnel de linstitution responsable de la collecte des donnes.
Les fichiers danalyses des donnes crs partir de lenqute MICS3 doivent tre archivs (sauvegards dans un format accessible), documents et distribus. Au minimum, la documentation
qui est jointe aux fichiers danalyse des donnes doit inclure une copie du rapport complet, une
copie des questionnaires et une description du plan de sondage. La documentation doit galement
comprendre un manuel de codification contenant lemplacement et la description de chaque variable dans le fichier danalyse (qui peut facilement tre cr dans SPSS). Vous devez archiver
une copie de tous les programmes et fichiers utiliss au cours du traitement et de lanalyse des
donnes de lenqute, et les rendre disponibles la demande. Une copie des fichiers danalyse et
de leur documentation doit tre envoye au Bureau rgional et au sige central de lUNICEF
New York (Section des Statistiques et du Suivi Statistics and Monitoring Section). Par ailleurs,
une politique et une procdure pour la distribution du fichier des donnes aux autres parties prenantes doivent tre tablies.

7.38

MANUEL DE LENQUETE PAR GRAPPES A INDICATEURS MULTIPLES

Tableau 7.7
Liste de contrle
Avant la descente sur le terrain :
Obtenir les ordinateurs et les autres quipements de traitement et danalyse des donnes.
Mettre en place une salle ou un espace pour le traitement des donnes.
Recruter un superviseur du traitement et de lanalyse des donnes et le personnel additionnel.
Mettre en place un systme pour lorganisation des activits de traitement des donnes.
Adapter les programmes pour quils soient en cohrence avec le questionnaire du pr-test.
Saisir et apurer les questionnaires du pr-test.
Finaliser les programmes en se basant sur lexprience du pr-test et les adapter selon le questionnaire final.
Pendant le travail de terrain :
Rceptionner les questionnaires venant du terrain.
Procder laffectation de la saisie des donnes primaires.
Vrifier la structure du fichier des donnes primaires saisies.
Procder laffectation de la saisie des donnes de vrification.
Vrifier que les donnes primaires et les donnes de vrification sont identiques.
Sauvegarder le fichier de donnes brutes.
Procder lapurement secondaire.
Sauvegarder le fichier de donnes apures (ou fichier final).
Aprs la tourne de collecte sur le terrain :
Exporter les donnes vers SPSS.
Recoder les variables.
Calculer et ajouter les poids de lchantillon, lindice de richesse et les donnes GPS.
Lancer les programmes de tabulation.
Archiver les donnes et dvelopper un systme et des procdures de distribution des donnes
(par exemple, un site Web).
Envoyer les fichiers danalyse, la documentation y affrant et tous les programmes lUNICEF.

Numro
de grappe

Date reue

Mnages slectionns
Mnages

Femmes

Enfants

Nombre de Questionnaires

V:

P:

V:

P:

V:

P:

V:

P:

V:

P:

V:

P:

V:

P:

V:

P:

V:

P:

V:

P:

Nom de
lagent de
saisie

Numro de
lagent de
saisie

Saisie des donnes


Date de
cration

Date de
simple
contrle final
Date de vrification finale

Tableau 7.8
Exemple de Formulaire de Suivi du Traitement de la Grappe
Date de
sauvegarde
des donnes brutes

Date
dapurement

Date de
sauvegarde
finale