Vous êtes sur la page 1sur 82

App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au

Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Méthodes et techniques de
collecte et analyse de données

Formation (version initiation)


Document 1 : Cahier de l’apprenant

Proposé par
KOUTON Etienne Folabi

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 1 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

TABLE DES MATIERES


THEME 1 : ELEMENTS DE BASE, TERMINOLOGIE, CONCEPTS ET DEFINITIONS .............................. 5
1.1. ELEMENTS DE BASE ........................................................................................................ 5
1.1.1. POPULATION ..................................................................................................................... 5
1.1.2. RECENSEMENT .................................................................................................................. 5
1.1.3. INDIVIDU OU UNITE STATISTIQUE ..................................................................................... 5
1.1.4. UNITE DE COLLECTE OU D’ECHANTILLONNAGE ............................................................. 6
1.1.5. VARIABLE ALEATOIRE ...................................................................................................... 6
1.1.6. VARIABLE ALEATOIRE QUALITATIVE ............................................................................... 6
1.1.7. VARIABLE ALEATOIRE QUANTITATIVE DISCRETE ........................................................... 6
1.1.8. VARIABLE ALEATOIRE QUANTITATIVE CONTINUE .......................................................... 6
1.1.9. DONNEES PRIMAIRES ET SECONDAIRES ......................................................................... 7
1.1.10. DONNEES EN COUPE TRANSVERSALE .......................................................................... 7
1.1.11. SERIE TEMPORELLE OU CHRONOLOGIQUE ................................................................... 7
1.1.12. DONNEES EN PANEL ....................................................................................................... 7
1.2. ECHANTILLONNAGE ........................................................................................................ 7
1.2.1. ECHANTILLON ................................................................................................................... 7
1.2.2. ECHANTILLONNAGE PROBABILISTE .............................................................................. 10
1.2.3. ECHANTILLONNAGE RAISONNE OU NON ALEATOIRE ................................................... 13
THEME 2 : TECHNIQUES D’ENQUETE ET COLLECTE DES DONNEES ............................................. 17
2.1. ENQUETE STATISTIQUE ........................................................................................................ 17
2.1.1. DEFINITION ET GENERALITES ............................................................................................. 17
2.1.2. PRINCIPALES ETAPES D’UNE ENQUETE STATISTIQUE .......................................................... 18
2.1.2.1. FORMULATION DE L’ENONCE DES OBJECTIFS ................................................................. 18
2.1.2.2. SELECTION D’UNE BASE DE SONDAGE ............................................................................ 18
2.1.2.3. CHOIX D’UN PLAN D’ECHANTILLONNAGE ..................................................................... 19
2.1.2.4. CONCEPTION DU QUESTIONNAIRE ............................................................................... 19
2.1.2.5. COLLECTE DES DONNEES ................................................................................................ 20
2.1.2.5.1. AUTODENOMBREMENT ............................................................................................... 20
2.1.2.5.2. INTERVIEWS SUR PLACE OU LE FACE A FACE ................................................................ 20
2.1.2.5.3. INTERVIEWS TELEPHONIQUES ..................................................................................... 21

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 2 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

2.1.2.5.4. AUTRES METHODE DE COLLECTE ................................................................................. 21


2.1.3. L’EQUIPE DE L’ENQUETE .................................................................................................... 21
2.1.4. LA FORMATION DES AGENTS ............................................................................................ 22
2.1.5. SAISIE ET CODAGE DES DONNEES ...................................................................................... 24
2.1.6. VERIFICATION ET IMPUTATION ........................................................................................ 24
2.1.7. ESTIMATION ...................................................................................................................... 25
2.1.7. ANALYSE DES DONNEES ..................................................................................................... 26
2.1.8. DIFFUSION DES DONNEES ................................................................................................. 27
2.1.9. DOCUMENTATION ........................................................................................................... 28
2.2. CYCLE DE VIE D’UNE ENQUETE STATISTIQUE ....................................................................... 28
2.2.1. PLANIFICATION DE L’ENQUETE ......................................................................................... 28
2.2.2. CONCEPTION ET ELABORATION ...................................................................................... 29
2.2.3. MISE EN OEUVRE .............................................................................................................. 30
2.2.4. ÉVALUATION DE L’ENQUETE ............................................................................................ 30
2.3. INSTRUMENTS DE COLLECTE ............................................................................................... 31
2.3.1. QUESTIONNAIRE ............................................................................................................... 31
2.3.1.1. CONSULTATION AVEC LES EXPERTS DU DOMAINE, LES UTILISATEURS DES DONNEES ET LES
REPONDANTS ............................................................................................................................. 32
2.3.1.2. EXAMEN DES QUESTIONNAIRES PRECEDENTS ................................................................. 33
2.3.1.3 REDACTION DE LA VERSION PROVISOIRE DU QUESTIONNAIRE ...................................... 34
2.3.1.4 EXAMEN DU QUESTIONNAIRE AUPRES DES UTILISATEURS DES DONNEES ........................ 34
2.3.1.5 MISE A L’ESSAI ET REVISION DU QUESTIONNAIRE ............................................................ 34
2.3.1.6. TOUCHE FINALE APPORTEE AU QUESTIONNAIRE .......................................................... 36
2.3.1.7. QUESTION OUVERTE ...................................................................................................... 36
2.3.1.8. QUESTION FERMEE ......................................................................................................... 37
2.4. ASPECTS JURIDIQUES DES ENQUETES STATISTIQUES ............................................................. 38
2.4.1. LE CONSEIL NATIONAL DE LA STATISTIQUE (CNS) ............................................................. 38
Le fonctionnement du CNS ............................................................................................................ 39
Les attributions des commissions du CNS...................................................................................... 39
2.4.2. LE VISA STATISTIQUE ......................................................................................................... 40
2.4.3. CONSENTEMENT ECLAIRE ET SECRET STATISTIQUE ........................................................... 42
III. THEME 3 : TRAITEMENT ET ANALYSE DES DONNEES ............................................................. 44
3.1. TRAITEMENT DES DONNES................................................................................................... 44

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 3 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

3.1.1. LES MODES DE SAISIE .......................................................................................................... 44


3.1.2. LE CODAGE........................................................................................................................ 45
3.1.3. L’APUREMENT ................................................................................................................... 47
3.1.4. TABULATION ..................................................................................................................... 47
3.2. ANALYSE DESCRIPTIVE ......................................................................................................... 49
3.2.1. DESCRIPTION INTRINSEQUE D’UNE DISTRIBUTION D’OBSERVATIONS .............................. 50
3.2.2. VISUALISATION GRAPHIQUE D’UNE DISTRIBUTION D’OBSERVATIONS ............................. 52
3.2.2.1. VISUALISER LA DISTRIBUTION D’UNE VARIABLE CATEGORIELLE ...................................... 52
3.2.2.2. VISUALISER LA DISTRIBUTION D’UNE VARIABLE NUMERIQUE CONTINUE ..................... 53
3.2.2.3. STATISTIQUES SOMMAIRES D’UNE VARIABLE NUMERIQUE CONTINUE : MOYENNE,
VARIANCE ET ECART-TYPE .......................................................................................................... 54
3.2.2.4. STATISTIQUES DE RANG ................................................................................................. 56
3.2.2.5. BOITE A MOUSTACHES .................................................................................................. 57
3.2.2.6. RESUME – STATISTIQUES D’UNE VARIABLE ..................................................................... 60
3.3. ANALYSE DE DEUX VARIABLES .............................................................................................. 61
3.4. ANALYSE EXPLICATIVE ......................................................................................................... 62
3.4.1. RELATION ENTRE DEUX VARIABLES ................................................................................... 63
3.4.2. COVARIANCE ET CORRELATION ....................................................................................... 63
3.5. TESTS STATISTIQUES ............................................................................................................. 65
IV. THEME 4 : CONCEPTS UTILISES DANS LES ENQUETES SUR LE SECTEUR AGRICOLE ................. 66
4.1. DIVERS CONCEPTS ET DEFINITIONS. ..................................................................................... 66
4.1.1. IDENTIFICATION ................................................................................................................ 66
4.2. ERREURS DE MESURE DANS LES ENQUETES AGRICOLES ........................................................ 80
4.2. SOURCES ET MESURE DES PERTES ALIMENTAIRES (ODD 12.3.1) ............................................. 81
BIBLIOGRAPHIE .......................................................................................................................... 81

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 4 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Thème 1 : Eléments de base, terminologie, concepts et définitions

1.1. Eléments de base

Dès lors que l’on étudie un groupe d’individu de même nature afin de le caractériser
statistiquement, on doit faire la distinction entre deux termes fondamentaux : population
et échantillon.

1.1.1. Population

Population : ensemble de tous les individus. Cet ensemble peut être de taille fini
(ensemble des poids de poudre contenu par flacon pour un lot de fabrication donné) ou
de taille non définie ou infinie car il est impossible d’en faire une étude exhaustive
(ensemble des personnes présentant un caractère génétique particulier).

1.1.2. Recensement

Recensement : Le recensement est le dénombrement exhaustif des unités d’une


population statistique et la mesure d’un ensemble de variables caractéristiques de ces
unités.
Exemples : - Le recensement général de la population consiste à dénombrer toutes les
personnes vivant sur le territoire national et à observer les caractéristiques individuelles
telles que l’âge, le sexe, l’activité économique, le niveau d’instruction ainsi que les
caractéristiques de groupes d’individus tels que le ménage (taille, nombre d’actifs, etc.) ;
- recensement du cheptel ;
- recensement de l’agriculture.

1.1.3. Individu ou unité statistique

Individu ou unité statistique : unité d’observation ou de mesure pour laquelle des


données sont recueillies. Elle est l’unité de base pour compiler et tabuler les données
statistiques.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 5 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

1.1.4. Unité de collecte ou d’échantillonnage

Unité de collecte ou d’échantillonnage: unité à partir de laquelle on collecte les


informations sur les unités statistiques. Elle peut être différente de l’unité statistique. Par
exemple, on sélectionne des ménages (unité de collecte) pour collecter des information
sur les parcelles agricoles (unité statistique).

1.1.5. Variable aléatoire

Variable aléatoire : Une variable est une entité qui peut prendre toutes les valeurs d’un
ensemble de définition donné. On la dénommera variable aléatoire si la valeur obtenue
est soumise au hasard. Par opposition, une variable déterministe donne toujours la même
valeur pour un effet donné (interrupteur arrêt/marche). Une variable aléatoire est
représentée par une lettre majuscule ( X, Y, Z) alors que les valeurs prises par cette
variable sont représentées par des lettres minuscules (x1, x2,... ; y1, y2,... ; z1, z2,...).

1.1.6. Variable aléatoire qualitative

Variable aléatoire qualitative : C'est une variable qui porte sur des grandeurs non
numériques. Exemple : le sexe (homme/femme), les opinions (oui/non), le niveau de
satisfaction (très satisfait, peu satisfait, pas du tout satisfait), le niveau d’instruction
(aucun, primaire, secondaire, universitaire) etc.

1.1.7. Variable aléatoire quantitative discrète

Variable aléatoire quantitative discrète : C’est une variable qui ne peut prendre qu’une
suite finie de valeurs sur l’ensemble des nombres entiers. Exemple : Nombre d’enfants
dans un ménage, nombre d’années d’étude achevées, nombre de jours ouvrés au cours
de la semaine, etc.

1.1.8. Variable aléatoire quantitative continue

Variable aléatoire quantitative continue

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 6 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

: Ce type de variable peut prendre toutes les valeurs d’un intervalle fini ou infini (y compris
les décimales). Exemple : l’âge exact, le salaire, la production mensuelle de céréales,
etc.

1.1.9. Données primaires et secondaires

Données primaires et secondaires : Les données primaires sont des données


spécialement collectées pour répondre à une étude statistique précise. Par opposition,
les données secondaires sont des données qui existent déjà au moment de l’étude et qui
peuvent avoir été collectées pour des raisons différentes. Ce sont par exemple, les
données issues de l’activité courante des administrations et des entreprises.

1.1.10. Données en coupe transversale

Données en coupe transversale : données pour lesquelles on observe les unités


statistiques à une date donnée.

1.1.11. Série temporelle ou chronologique

Série temporelle ou chronologique : suite de valeurs numériques représentant


l'évolution d'une variable aléatoire au cours du temps pour une même unité statistique.

1.1.12. Données en panel

Données en panel: données qui comprennent plusieurs observations au cours du temps


pour une même unité statistique

1.2. Echantillonnage

1.2.1. Echantillon

Echantillon : sous-ensemble de n individus (d’effectif n) extrait de la population pour


lesquels on a mesuré (observé) un caractère quantitatif ou qualitatif. L’obtention d’un
échantillon est une étape clé dans la démarche statistique car cet ensemble de données
permet de conclure sur les propriétés d’une population donnée. Si l’échantillon est extrait

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 7 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

de manière à refléter autant que possible l’ensemble de la population, on


parlera d’échantillon représentatif de la population.

En raison de contraintes de budget et de temps, il n’est en général pas possible de


recueillir des données auprès de tous les ménages ou toutes les personnes dans le cadre
d’une étude. C’est pourquoi, dans la plupart des cas, on sélectionne une partie seulement
du groupe à étudier, pour donner des informations fiables sur l’ensemble du groupe.
L’échantillonnage est la technique par laquelle on choisit une partie représentative de la
population pour déterminer les caractéristiques de l’ensemble de la population étudiée.
Ce n’est que si un échantillon est statistiquement représentatif que les données des
unités statistiques de l’échantillon reflètent la situation véritable de l’ensemble de la
population de base.
Pour procéder à l’échantillonnage, il faut : i) définir la population d’intérêt ou population
cible et l’unité d’échantillonnage ; ii) fixer la taille de l’échantillon ; iii) sélectionner une
base de sondage et iv) fixer une méthode d’échantillonnage.

i) Définir la population d’intérêt et l’unité d’échantillonnage


La population d’intérêt, c’est l’ensemble des individus (unités statistiques) que l’on veut
étudier. L’unité d’échantillonnage ne correspond pas forcément à l’unité statistique (voir
point 1 ci-dessus).

ii) Fixer la taille de l’échantillon


La taille de l’échantillon a des répercussions directes sur les considérations
opérationnelles, notamment sur le budget et le temps de réalisation de l’enquête. Il faut
donc trouver un compromis entre les contraintes en termes de ressources disponibles et
le besoin de précision des résultats et estimations de l’enquête. Si l’on opte pour une
méthode probabiliste d’échantillonnage (voir iv ci-dessous), on utilisera des formules
probabilistes pour calculer la taille minimale de l’échantillon en fixant une marge d’erreur
et un niveau de pouvoir statistique donnés (couramment les valeurs de 5% et de 80%

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 8 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

sont utilisées), de même qu’un niveau anticipé de non réponse. La formule à utiliser
dépend du but de l’enquête, des informations disponibles a priori et de la méthode
d’échantillonnage adoptée.

iii) Sélectionner une base de sondage


La base de sondage est une liste d’unités (individus ou groupe d’individus) qui couvre
toute la population avec une identification de chaque unité. Cette liste doit être exhaustive
(sinon défaut de couverture) et sans doublon. Elle doit donc être le plus à jour que
possible.
Il existe trois types de base de sondage :
- Les listes : il peut s’agir d’une liste pré existante (fichier de données du dernier
recensement ou d‘un annuaire téléphonique ; ou d’une liste spécialement conçue pour
les besoins de l’enquête (exemple une liste de tous les véhicules qui entrent au
stationnement d’un centre commercial entre 9 h et 20 h pendant une journée en
particulier) ;

- Les bases aréolaires : c’est une liste dont les unités correspondent à des secteurs
géographiques (exemple les zone de dénombrement, les arrondissements) et dont les
unités composantes sont des ménages, des fermes, des entreprises, etc.

- Les bases de sondage multiples : c’est une combinaison de deux ou plusieurs bases
(des listes et des bases aréolaires ou deux listes ou plus). Les bases de sondage
multiples sont habituellement utilisées lorsqu’aucune base unique ne peut fournir la
couverture nécessaire de la population cible. Lors d’une enquête sur les entreprises, on
peut par exemple utiliser le fichier du dernier recensement des entreprises et le fichier
du registre du commerce pour avoir des informations plus complètes.
La base de sondage choisie détermine la définition de la population de l’enquête et peut
avoir des répercussions sur les méthodes de collecte des données, de sélection et
d’estimation de l’échantillon, ainsi que sur le coût de l’enquête et la qualité des résultats.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 9 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Par exemple, si on utilise le fichier du registre de commerce pour sélectionner un


échantillon d’entreprises, toutes les entreprises informelles seront alors exclus de
l’enquête.

iv) Fixer une méthode d’échantillonnage


Il existe deux types de méthodes d'échantillonnage : L'échantillonnage probabiliste ou
aléatoire et l'échantillonnage non probabiliste ou empirique. Les échantillons aléatoires
sont constitués par tirage au sort dans la population mère pour laquelle on dispose d’une
base de sondage. Alors que pour l’échantillonnage non probabiliste, on n’a pas besoin
de la base de sondage. Une autre différence qui existe entre les deux tient au fait que
dans le cas de l'échantillonnage probabiliste chaque unité a une « chance » d'être
sélectionnée qui peut être quantifiée, ce qui n'est pas le cas pour l'échantillonnage non
probabiliste.

1.2.2. Echantillonnage probabiliste

Il est plus complexe, prend plus de temps et est habituellement plus coûteux que
l'échantillonnage non probabiliste. On distingue quatre grandes méthodes :
l’échantillonnage aléatoire simple, l’échantillonnage aléatoire systématique,
l’échantillonnage aléatoire stratifié et l’échantillonnage aléatoire par grappe.
▪ Echantillonnage aléatoire simple
L’échantillonnage aléatoire simple est une méthode qui consiste à prélever au hasard et
de façon indépendante, n individus ou unités d’échantillonnage d’une population à N
individus. Dans ce cas, chaque membre d'une population a une chance égale d'être
inclus à l'intérieur de l'échantillon. Cette méthode est appliquée quand la population
possède des caractéristiques homogènes et que nous détenons une base de sondage.
Le choix du tirage peut se faire avec remise (un individu peut être choisi plusieurs fois)
ou sans remise (un individu déjà choisi ne peut l’être de nouveau).

Si l’on note n la taille de l’échantillon et N la taille de la population, on peut tirer :

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 10 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Nn échantillons pour un tirage avec remise et 𝐂𝐍𝐧 échantillons pour un tirage sans remise.
Avantages : facile à implémenter et on peut espérer un échantillon «représentatif» (en
particulier pour le tirage sans remise) puisque la méthode donne à chaque individu de la
population une chance égale.
Inconvénients: la méthode n’est applicable que lorsqu’il existe une liste exhaustive de
toute la population.
Exemple : À partir du bottin téléphonique de l'entreprise, utiliser une table de nombre
aléatoire pour choisir l'échantillon.
▪ Echantillonnage aléatoire systématique
L’échantillonnage systématique est une méthode qui exige aussi l’existence d’une liste
de la base de sondage où chaque individu est numéroté de 1 jusqu’à N.
Notons n, le nombre d’individus que doit comporter l’échantillon (la taille de l’échantillon).
L’entier voisin de 𝑵/𝒏 sera noté « r » et appelé « raison de sondage » ou « pas de
sondage » qui correspond aux nombres d’échantillons possibles que l’on peut tirer. On
choisit au hasard un entier naturel d entre 1 et r (cet entier sera le point de départ).
L’individu dont le numéro correspond à d est le premier individu. Pour sélectionner les
autres, il suffit d’ajouter à d la raison de sondage.
Exemple : On a une population de 400 individus, on veut un échantillon de 100 individus.
De ce fait, r = 400/100=4
On n’a donc que 4 échantillons possibles.
1, 5, 9,13, 17, …, 397
2, 6, 10, 14, 18, …, 398
3, 7, 11, 15, 19, …, 399
4, 8, 12, 16, 20,…, 400

Avantages : facile à sélectionner parce qu’un seul individu est choisi au hasard. On peut
obtenir une bonne précision parce que la méthode permet de répartir l’échantillon dans
l’ensemble de la liste.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 11 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Inconvénients : Les données peuvent être biaisées à cause de la périodicité s’il n’y a pas
homogénéité des caractéristiques de la population. Ainsi, si on a des données
périodiques (par exemple données journalières) et que la raison correspond à la période
(dans cet exemple, le nombre de jour dans une semaine), alors on aura une périodicité
dans les données (exemple, observations uniquement les jeudis).

▪ Echantillonnage stratifié
On divise la population en groupes homogènes (appelés strates), qui sont mutuellement
exclusifs (selon l'âge, le sexe, la province de résidence, le revenu, etc.).
Les variables de stratification doivent être simples à utiliser, facile à observer et liées au
thème de l’enquête. Proportionnellement à son importance dans la population, on calcule
combien il faut d’individus au sein de l’échantillon pour représenter chaque strate et dans
chacune des strates, on sélectionne des échantillons indépendants. On peut utiliser
n'importe quelle des méthodes d'échantillonnage à cet effet.

Exemple 1 : Choisir par échantillonnage stratifié, 20 élèves dans un groupe de 50, en


tenant compte du fait que 30 d’entre eux sont des garçons.
Solution : On aura 12 garçons et 8 filles dans l’échantillon de 20 élevés.

Exemple 2 : Répartir l’échantillon de 345 individus entre les 5 villes considérées comme
des strates.
1 2 3 4

Taille de la population Pourcentage (%) de la Taille de l’échantillon


Lieu population stratifié

Ville 1 1200 38% 129

Ville 2 900 28% 97

Ville 3 800 25% 86

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 12 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Ville 4 180 6% 19

Ville 5 120 4% 13

Total 3200 345

▪ Echantillonnage par grappe et à plusieurs degrés


On sélectionne au hasard un certain nombre de grappes (des groupes qui ne sont pas
forcément homogènes à l’intérieur) pour représenter la population.
- Si on enquête tous les individus des grappes choisies, on parle de sondage par grappe

Avantages : La méthode ne nécessite pas forcement une base de sondage puisque seuls
les individus inclus dans les grappes comptent ; mais on a besoin d’un listing complet des
grappes. Elle permet de limiter l’échantillon à des groupes compacts ce qui permet de
réduire les coûts de déplacement, de suivi et de supervision.
Inconvénients : La méthode peut entraîner des résultats imprécis (moins précis que les
méthodes précédentes) puisque les unités voisines ont tendance à se ressembler. Elle
ne permet pas de contrôler la taille finale de l’échantillon.
- Si, dans chaque grappe, on tire encore un autre échantillon, on parle de sondage à deux
degrés. On peut avoir un sondage à plusieurs degrés (degré supérieur à 2). On a alors
besoin d’une base de sondage. Les unités d’échantillonnage au premier degré (les
grappes) sont appelées unités primaires et celle du second degré (par exemple les
ménages) sont appelées unités secondaires. La taille de l’échantillon final est déterminé
d’avance et de préférence en tenant compte de la corrélation intra classe.

1.2.3. Echantillonnage raisonné ou non aléatoire

La méthode d'échantillonnage non-probabiliste est utilisée lorsqu'il n'est pas possible de


constituer une liste exhaustive (base de sondage) de toutes les unités du sondage. Afin

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 13 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

de faire des déductions sur la population à partir d’un échantillon non probabiliste,
l’analyste des données doit supposer que l’échantillon est représentatif de la population.
On ne peut mesurer la fiabilité d'un échantillonnage non probabiliste; la seule façon de
mesurer la qualité des données en résultant consiste à comparer certains des résultats
de l'enquête à l'information dont on dispose au sujet de la population. Par ailleurs, il
n'existe aucun moyen de mesurer la précision des échantillons en découlant.
L’échantillonnage non probabiliste est utilisée pour des études exploratoires, pour réduire
les coûts, pour l’analyse des petits échantillons ou quand il est impossible ou non
envisageable d’utiliser la méthode aléatoire. Il existe plusieurs méthodes
d’échantillonnage non probabiliste, les plus connues sont les suivantes : la méthode de
quotas, la méthode de volontaires, la méthode de boule neige, la méthode
d’échantillonnage ciblé et la méthode de panel ouvert.
▪ La méthode de quotas
La méthode de quotas est une technique d’échantillonnage qui s’impose à chaque fois
qu’il faut utiliser un échantillon représentatif alors qu’il n’est pas facile de disposer d’une
liste de sondage et que la structure de la population à étudier est connue. Elle repose non plus
sur le hasard, au sens statistique du terme, mais sur le raisonnement de l’analyste qui choisit des
éléments composants l’échantillon en fonction de critères de sélection jugés pertinents en regard
du problème à résoudre. Les critères de sélection sont appelés « variable de quotas ou de
contrôle».
Cette méthode consiste à construire un échantillon représentatif à partir de certains
critères clés appelés « variable de quota ou de contrôle ».
Cette méthode est largement utilisée dans les enquêtes d’opinion et les études de
marché notamment parce qu’il ne suppose pas de liste des individus de la population. On
parle aussi d’échantillonnage dirigé ou par choix raisonné. On demande aux enquêteurs
de faire un nombre d’entrevues dans divers groupes établis en tenant compte de la
répartition de l’échantillon à partir des variables de quotas. L’enquêteur doit respecter son
quota.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 14 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Il faut noter qu’on ne doit retenir qu'un nombre restreint de quotas (au maximum trois
variables de quotas).
Avantages : L'échantillonnage par quotas est généralement moins coûteux que
l'échantillonnage aléatoire. Il est également facile à administrer.
Inconvénients : Certaines unités peuvent n'avoir aucune chance d'être sélectionnées (voir
la méthode de la théorie des valeurs extrêmes).

▪ La méthode de volontaires ou de convenance


On prélève l'échantillon à partir d'un groupe de volontaires (Exemples : expériences
médicales ou psychologiques). Dans ce cas, l’échantillon est composé de toutes les
personnes que l’analyse considère concernées (population cible) et volontaires
(acceptent d’y participer) par le sujet de l’étude.
Avantages : Cette méthode est très facile à appliquer car l’enquêteur ne se préoccupe
pas de convaincre les enquêtés. Il ne s’intéresse qu’à ceux qui ont accepté de répondre.
Inconvénients : échantillon biaisé car aucune stratégie de sélection n’est suivie pour
s’assurer que l’échantillon ainsi constitué est bien représentatif de la population cible.
L’échantillonnage ciblé ou échantillonnage à la place

Cette méthode consiste à obtenir un échantillon d’éléments recrutés en des lieux où la


probabilité de rencontrer les personnes concernées par la thématique de l’étude est
très élevée.

Avantages : Ce type d’échantillon est largement utilisé pour travailler sur des cibles
structurellement bien identifiées mais dispersées ou de faible effectif.
Inconvénients : échantillon biaisé.

▪ La méthode de boule de neige

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 15 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

C’est une méthode dont l’échantillon est composé d’individus recommandés par des
personnes déjà enquêtées.

Avantages : Ce type d’échantillon est largement utilisé en milieu industriel. Il est


également utile pour atteindre des populations très particulières ou pour pénétrer des
milieux fermés.
Inconvénients : difficulté d’obtention d’un échantillon représentatif si vous n’avez pas pu
avoir des recommandations.

▪ La méthode d’access panel ou de panel ouvert


L’access panel est un échantillon composé d’individus volontaires qui ont été recrutés
au cours des études précédemment réalisées. L’usage de cette méthode est fréquent
pour les études par Internet.
Avantages : Son principale avantage est de ne pas avoir à rechercher au hasard des
personnes à interrogées, mais de sélectionner sur une liste celles qui répondent aux
caractéristiques recherchées et de les contacter.
Inconvénients : Si la base n’est pas actualisée, on risque de ne pas retrouver les enquêtés
au cas où ils avaient changé d’adresse ou de numéro de téléphone.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 16 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Thème 2 : Techniques d’enquête et collecte des données

2.1. Enquête statistique

2.1.1. Définition et généralités

Une enquête statistique ou enquête par sondage est une opération statistique qui
consiste à étudier certaines variables d’une population statistique donnée à partir de
l’observation des caractéristiques de ces variables sur un sous-ensemble de la
population. Ce sous-ensemble est appelé échantillon et ses éléments doivent être
judicieusement choisis de manière à ce qu’il assure une bonne représentativité de la
population. Si les éléments du sous-ensemble sont tirés au hasard, alors l’échantillon est
dit aléatoire et on parle de sondage aléatoire.

A la différence d’un recensement qui concerne toute la population, une enquête ne


concerne qu’une partie de la population. Toute enquête statistique est sujette à deux
types d’erreur qu’on s’efforcera de minimiser :
- l’erreur d’échantillonnage : Elle est associée directement avec le plan
d’échantillonnage et les méthodes d’estimation utilisées. Elle indique le degré
d’incertitude au sujet de la véritable valeur en fonction de l’information obtenue selon
le nombre de personne ayant répondu à l’enquête. Ce type d’erreur peut en général
être facilement contrôlé au moyen de méthode appropriés d’échantillonnage, en
produisant par exemple les marges d’erreur d’échantillonnage assortis d’intervalles
de confiance.
- et les erreurs non dues à l’échantillonnage : Erreur de mesure systématique ou non
(due entre autre à la formulation ou à l’ordre des questions), erreur de couverture
(unités manquantes ou inclusion d’unités non sélectionnées), erreur de non-

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 17 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

réponse, erreur de saisie, erreur de vérification et d’imputation. Ce type d’erreur est


plus difficile à déceler, à contrôler et à mesurer, et peut induire des biais importants.

En fonction des unités statistiques concernées, on a les enquêtes ménages, des


enquêtes entreprises, des enquêtes agricoles, etc.

Une enquête comprend plusieurs étapes liées entre elles, notamment, la définition des
objectifs, la sélection d’une base de sondage, le choix du plan d’échantillonnage, la
conception du questionnaire, la collecte et le traitement des données, l’analyse et la
diffusion des données, et la documentation de
l’enquête.

2.1.2. Principales étapes d’une enquête statistique

2.1.2.1. Formulation de l’énoncé des objectifs

La formulation de l’énoncé des objectifs est l’une des plus importantes tâches d’une
enquête. Elle établit non seulement les besoins d’information de l’enquête dans
l’ensemble, mais aussi les définitions opérationnelles à utiliser, les sujets à considérer en
particulier et le plan d’analyse. Cette étape de l’enquête détermine ce qu’elle comprendra
ou non, ce que le client a besoin de savoir plutôt que ce qui serait intéressant d’apprendre.

2.1.2.2. Sélection d’une base de sondage

La base du sondage donne les moyens d’identifier les unités de la population de


l’enquête et de communiquer avec elles. La base prend la forme d’une liste, par
exemple :
- une liste physique, notamment, un fichier de données, un imprimé d’ordinateur ou un
annuaire téléphonique.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 18 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

- une liste conceptuelle, par exemple une liste de tous les véhicules qui entrent au
stationnement d’un centre commercial entre 9 h et 20 h pendant une journée en
particulier.
- une liste géographique dont les unités correspondent à des secteurs géographiques et
dont les unités composantes sont des ménages, des fermes, des entreprises, etc.

Un organisme statistique peut habituellement utiliser, approfondir ou créer une base de


sondage. La base choisie détermine la définition de la population de l’enquête et peut
avoir des répercussions sur les méthodes de collecte des données, de sélection et
d’estimation de l’échantillon, ainsi que sur le coût de l’enquête et la qualité des résultats.

2.1.2.3. Choix d’un plan d’échantillonnage

Avant d’échantillonner, il faut : définir la population d’intérêt ou population cible et l’unité


d’enquête, fixer la taille de l’échantillon, sélectionner une base de sondage, fixer une
méthode d’échantillonnage, donner la répartition de l’échantillon sur l’ensemble de
l’univers sondé, calculer les pondérations si nécessaire. Tous ces éléments sont
consignés dans un document dénommé plan d’échantillonnage ou plan de sondage.

2.1.2.4. Conception du questionnaire

Un questionnaire (ou un formulaire) est un groupe ou une séquence de questions


formulées pour obtenir d’un répondant de l’information sur un sujet. Les
questionnaires sont au coeur du processus de collecte des données parce qu’ils ont des
répercussions importantes sur la qualité des données et une incidence sur l’image de
marque que projette l’organisme statistique dans le grand public. Les questionnaires sont
sur support papier ou électronique.
La conception d’un questionnaire suscite des interrogations : quelles questions poser,
comment les formuler au mieux et comment organiser les questions pour obtenir
l’information voulue? Le but est d’obtenir de l’information et, à cette fin, les répondants

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 19 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

doivent comprendre les questions et donner facilement les réponses exactes en un


format qui convient au traitement ultérieur et à l’analyse des données. Il y a des principes
bien établis de conception d’un questionnaire, mais la création d’un bon questionnaire
est un art qui demande de l’ingéniosité, de l’expérience et des mises à l’essai. Si les
besoins de données ne sont pas transformés correctement en un instrument de collecte
des données structuré de qualité élevée, un « bon » échantillon peut donner de « mauvais
» résultats. Ce sujet est approfondi a la section II. Instruments de collecte ci-dessous.

2.1.2.5. Collecte des données

La collecte des données est le processus appliqué pour obtenir l’information


nécessaire de chaque unité sélectionnée dans l’enquête. Les méthodes élémentaires
de collecte des données sont :

2.1.2.5.1. Autodénombrement

Le répondant remplit le questionnaire d’enquête par autodénombrement sans l’aide d’un


intervieweur.
Divers moyens peuvent servir à envoyer le questionnaire au répondant et à le retourner
à l’expéditeur : le service postal, le télécopieur, un moyen électronique (y compris
Internet) ou un enquêteur. Si le questionnaire est retourné par télécopieur ou sur support
électronique, une ligne sécuritaire ou le chiffrage est alors nécessaire pour garantir la
confidentialité des données du répondant. La méthode sur support papier est intitulée
Interview Papier et Crayon (IPC) et la méthode sur support électronique est intitulée Auto-
Interview Assistée par Ordinateur (AIAO).

2.1.2.5.2. Interviews sur place ou le face à face

Un intervieweur aide le répondant à remplir le questionnaire. L’interview se déroule sur


place, habituellement à la résidence du répondant ou en milieu de travail, même si elle
peut avoir lieu dans un endroit public (p. ex., aéroport, centre commercial). La méthode

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 20 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

sur support papier est intitulée Interview Papier et Crayon (IPC) et la méthode assistée
par ordinateur est intitulée Interview sur Place Assistée par Ordinateur (IPAO).

2.1.2.5.3. Interviews téléphoniques

Un intervieweur aide le répondant à remplir le questionnaire au téléphone. La méthode


sur support papier est intitulée interview papier et crayon (IPC) et la méthode assistée
par ordinateur est intitulée Interview Téléphonique Assistée par Ordinateur (ITAO).

2.1.2.5.4. Autres méthode de collecte

D’autres méthodes de collecte de données comprennent l’observation directe, la


déclaration électronique des données et l’utilisation des données administratives.

La collecte des données peut être faite sur support papier ou électronique. Si une
méthode de collecte sur support papier est privilégiée, les réponses sont inscrites dans
des questionnaires imprimés. Si on opte plutôt pour une méthode assistée par ordinateur,
le questionnaire est affiché à l’écran de l’ordinateur et les réponses sont entrées
directement au clavier. Les méthodes assistées par ordinateur ont un avantage : la saisie
des données ou transformation des réponses en format lisible par la machine est faite
pendant la collecte, éliminant ainsi cette activité du traitement après la collecte. Autre
avantage : les données non valables ou incohérentes peuvent être identifiées plus
rapidement que celles des questionnaires sur support papier.

2.1.3. L’équipe de l’enquête

Au moment où notre questionnaire sera prêt à être prétesté sur le terrain, nous devons
avoir rassemblé tout notre personnel pour l’enquête. Outre notre équipe de planification
de l’enquête, il nous faudra un personnel de terrain (enquêteurs, contrôleurs et

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 21 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

superviseurs), un personnel de traitement des données (codificateurs, tabulateurs et le


personnel de saisie de données) et un personnel d’analyse de données.
Les effectifs dont nous aurions besoin dépendront évidemment de la dimension de
l’enquête et du délai prévu pour la collecte et le traitement des données. Pour choisir
l’équipe d’enquête, nous devons prendre en compte les facteurs suivants :
• La personnalité : les membres de l’équipe doivent être capable de bien travailler
ensemble, de s’adapter, de s’aider les uns les autres et d’avoir une attitude
amicale envers les personnes interrogées ;

• Le niveau d’instruction des enquêteurs ;

• L’honnêteté des enquêteurs et des contrôleurs ;

• L’esprit managérial des superviseurs ;

• L’expérience antérieure des enquêteurs ;

• Les langues et dialectes parlés et écrits ;

• L’état de santé des enquêteurs ;

• Le sexe : si ce facteur est important pour des raisons culturelles dans la


composition des équipes d’enquêteurs.

• Choisir des personnes qui connaissent bien la zone de projet est un atout.

2.1.4. La formation des agents

Il faut prévoir un temps et des moyens suffisants pour apprendre aux enquêteurs, aux
contrôleurs et aux superviseurs à accomplir leurs tâches correctement, efficacement
et de manière standardisée.

L’enquêteur est un agent de terrain. Il a pour objectif de :

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 22 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

1- Prendre l’information à la base ;


2- Maitriser toutes les questions du questionnaire ;
3- Poser clairement les questions aux enquêtés ;
4- Transmettre dans le questionnaire toutes les réponses avec le maximum de
fidélité ;
5- Retourner tous les questionnaires et matériels4 remis par le contrôleur en parfait
état ;
6- Respecter toutes les instructions transmises par le contrôleur.

Le contrôleur est agent qui suit et encadre les enquêteurs sur trois aspects :
1- Organisationnel : il organise le travail de son équipe, sensibilise les unités de son
échantillons, s’assure que chaque membre de son équipe dispose du matériel nécessaire
au bon fonctionnement de l’enquête et transmet les informations importantes à son
superviseur ;

2- Technique : il s’assure que l’enquêteur a bien rempli ses questionnaires et a couvert


toutes les unités à enquêter de son échantillon ;

3- Pratique : il instaure au sein de son équipe un climat de confiance susceptible de


favoriser le bon déroulement du travail. En cas de problème ou de conflit, il est le
responsable. Il veille également au bon entretien et à la bonne conservation du matériel
de l’enquête.

Le superviseur est le principal responsable de l’enquête dans sa zone d’étude. Il


organise le travail concernant toute sa zone, assure le tirage des échantillons de sa zone,
sensibilise les chefs de sa zone, transmet les instructions importantes de la coordination
à ses contrôleurs, valide les travaux effectués par tous les enquêteurs après vérification
des contrôleurs et récupère tout le matériel auprès des contrôleurs.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 23 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

La formation des intervieweurs doit être soigneusement planifiée pour qu’ils aient tous un
rendement uniforme et la même compréhension des concepts de l’enquête. Un bon
programme de formation et un manuel clairement rédigé sont essentiels si l’on veut avoir
un personnel de terrain efficace.

L’étendu de la formation nécessaire dépend de la complexité de l’échantillon et du


questionnaire : les enquêteurs, les contrôleurs, les superviseurs et les agents de saisie
doivent comprendre parfaitement toutes les procédures qu’ils auront à appliquer.

2.1.5. Saisie et codage des données

Si les données n’ont pas été collectées au moyen d’une méthode assistée par ordinateur,
elles doivent être codées et saisies. Le codage est le processus d’affectation d’une
valeur numérique aux réponses pour faciliter la saisie et le traitement des données
en général. Certaines questions sont parfois pré codées sur le questionnaire même, mais
d’autres sont codées après la collecte pendant le traitement manuel ou automatisé.

La saisie et le codage des données sont des activités qui coûtent cher et qui demandent
beaucoup de temps, mais elles sont essentielles à la qualité des données parce que les
erreurs entrées peuvent avoir des répercussions sur les résultats finals de l’enquête. Il
faut donc mettre l’accent sur la prévention des erreurs dès les premières étapes.
L’assurance de la qualité et le contrôle qualitatif sont deux méthodes de surveillance et
de vérification des erreurs. L’objectif de l’assurance de la qualité est de prévoir et
d’empêcher les problèmes, et celui du contrôle qualitatif est de garantir que le nombre
d’erreurs est restreint aux limites acceptables.

2.1.6. Vérification et imputation

La vérification est l’application de mesures pour repérer les entrées manquantes,


non valables ou incohérentes qui indiquent des enregistrements de données

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 24 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

éventuellement erronées. L’objectif de la vérification est de mieux comprendre les


processus et les données de l’enquête pour garantir que les données finales de l’enquête
sont complètes, convergentes et valables. Les vérifications peuvent être de simples
mesures de contrôle manuel qu’appliquent les intervieweurs sur place ou des vérifications
complètes exécutées par un programme informatique. L’importance de la vérification faite
est un compromis entre l’objectif, c’est-à-dire que tous les enregistrements sont « parfaits
», et une somme raisonnable de ressources affectées (temps et argent) pour atteindre
cet objectif.
Certaines lacunes de vérification sont comblées à l’aide d’un suivi auprès du répondant
ou d’un examen manuel du questionnaire, mais il est à peu près impossible de corriger
toutes les erreurs ainsi, et l’imputation est souvent utilisée pour régler les autres cas.
L’imputation est un processus appliqué pour déterminer et attribuer des valeurs
de remplacement, afin de résoudre les problèmes de données manquantes, non
valables ou incohérentes.
L’imputation peut améliorer la qualité des données finales, mais il faut choisir
prudemment une méthodologie d’imputation appropriée. Certaines méthodes
d’imputation ne protègent pas les liens entre les variables ou peuvent en fait susciter une
distorsion des liens sous-jacents des données. Il faut tenir compte du genre d’enquête,
de ses objectifs et des caractéristiques de l’erreur pour choisir la méthode convenable.

2.1.7. Estimation

Après la collecte, la saisie, le codage, la vérification et l’imputation des données, l’étape


suivante est l’estimation. Il s’agit d’un moyen que l’organisme statistique applique
pour obtenir des valeurs de la population d’intérêt et tirer des conclusions sur cette
population à partir de l’information obtenue d’un échantillon seulement de la
population. Une estimation peut être un total, une moyenne, un ratio, un pourcentage,
etc.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 25 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Le fondement de l’estimation dans une enquête-échantillon est la pondération qui indique


le nombre moyen d’unités de la population représentée par une unité de l’échantillon. Un
total de la population peut être estimé, par exemple, en additionnant les valeurs
pondérées des unités de l’échantillon. Le plan de sondage dicte la pondération initiale.
Des modifications sont parfois apportées à cette pondération pour compenser, par
exemple, pour les unités qui ne répondent pas à l’enquête (c.-à-d. non-réponses totales)
ou pour tenir compte de l’information secondaire. Les modifications apportées pour les
non-réponses peuvent aussi s’appliquer aux données d’un recensement.

Une enquête peut accuser une erreur d’échantillonnage parce qu’une partie seulement
de la population est dénombrée et que les unités échantillonnées n’ont pas exactement
les mêmes caractéristiques que toutes les unités de la population représentée. Il faudrait
toujours ajouter une estimation de l’ampleur de l’erreur d’échantillonnage pour chaque
estimation, afin d’indiquer aux utilisateurs la qualité des données.

2.1.7. Analyse des données

L’analyse des données comprend le sommaire des données et l’interprétation de


leur signification pour obtenir des réponses claires aux questions qui ont motivé
l’enquête. L’analyse des données devrait nouer un lien entre les résultats de l’enquête
et les questions et problèmes mentionnés dans l’énoncé des objectifs. Il s’agit de l’une
des étapes les plus cruciales de l’enquête parce que la qualité de l’analyse peut avoir des
répercussions substantielles sur l’utilité de l’enquête dans l’ensemble. L’analyse des
données peut être restreinte aux données de l’enquête ou établir une comparaison entre
les estimations de l’enquête et les résultats d’autres enquêtes ou sources de données.
Elle consiste souvent à examiner des tableaux, des graphiques et diverses mesures
sommaires, par exemple, les moyennes et les répartitions des fréquences pour résumer
les données. L’inférence statistique peut servir à vérifier les hypothèses ou étudier les

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 26 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

liens entre des caractéristiques, par exemple, à l’aide de tests de régression, d’analyses
de l’écart ou du chi au carré.

2.1.8. Diffusion des données

La diffusion des données est la distribution des données de l’enquête aux


utilisateurs par l’intermédiaire de divers médias, par exemple, un communiqué, une
interview radio ou télédiffusée, une réponse téléphonique ou télécopiée à une demande
spéciale, la publication d’un document, une microfiche, un média électronique, y compris
Internet, ou un fichier de microdonnées sur CD, etc. La prestation et la présentation des
résultats finaux sont très importantes. Les utilisateurs devraient trouver, interpréter,
comprendre et utiliser correctement et facilement les résultats de l’enquête. Il faudrait
résumer les résultats de l’enquête, indiquer les points forts et les points faibles des
données, et mettre en évidence les détails importants dans un rapport écrit qui comprend
des tableaux et des graphiques.
Avant de diffuser les données, il faudrait en évaluer la qualité pour aider à considérer et
interpréter les résultats et la qualité de l’enquête, et informer les utilisateurs, afin qu’ils
jugent par eux-mêmes de l’utilité des données. Cette activité peut aussi donner des
renseignements précieux pour améliorer l’enquête (si elle est prévue de nouveau) ou
d’autres enquêtes. Cette évaluation et le rapport subséquent devraient comprendre une
description de la méthodologie de l’enquête, ainsi que les mesures et les sources
d’erreur.
Au volet du processus de diffusion, la loi oblige de nombreux organismes statistiques à
protéger la confidentialité de l’information des répondants. Le contrôle de la divulgation
englobe les mesures appliquées pour protéger les données diffusées, afin
d’empêcher toute infraction à la vie privée des répondants. Il s’agit, notamment,
d’identifier et d’éliminer (ou de modifier) les cases des tableaux qui risquent de révéler de
l’information sur une personne. Certaines données doivent habituellement être

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 27 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

supprimées ou modifiées. Avant de choisir une méthode de contrôle de la divulgation, il


faudrait comparer diverses méthodes, compte tenu de leurs répercussions sur les
résultats de l’enquête et du risque de divulgation pour une personne.

2.1.9. Documentation

La documentation donne un dossier de l’enquête et devrait comprendre chaque étape et


phase de l’enquête. Elle peut comprendre divers aspects de l’enquête et cibler différents
groupes, notamment, la direction, le personnel technique, les concepteurs d’autres
enquêtes et les utilisateurs. Un rapport sur la qualité des données, par exemple, donne
aux utilisateurs un contexte pour l’utilisation informée des données. Un rapport d’enquête
qui comprend, non seulement les décisions prises, mais aussi leurs justifications, donne
à la direction et au personnel technique de l’information utile pour l’élaboration et
l’application ultérieures d’enquêtes semblables. Au cours de la mise en oeuvre, la
documentation des procédures à l’intention du personnel aide à garantir un déroulement
efficace.

2.2. Cycle de vie d’une enquête statistique

Les étapes de l’enquête présentées ci-dessus ne sont pas nécessairement séquentielles


: certaines se déroulent en parallèle, d’autres, par exemple la vérification, sont réitérées
à divers moments pendant le processus de l’enquête. Chaque étape doit d’abord être
planifiée, conçue et élaborée, mise en œuvre ensuite et évaluée en bout de ligne. Les
phases de la vie utile d’une enquête sont :

2.2.1. Planification de l’enquête

La planification est la première phase du processus de l’enquête. Il faut mettre en place


une équipe interdisciplinaire est chargée de la planification, de la conception, de la mise

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 28 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

en œuvre et de l’évaluation de l’enquête. L’équipe interdisciplinaire est formée de


membres qui ont des aptitudes techniques différentes, par exemple, un statisticien, un
programmeur, un expert dans le domaine de l’étude, un expert de la collecte des
données, etc.
À l’étape préliminaire ou de proposition de l’enquête, seules les notions les plus générales
des besoins de données du client peuvent être connues. Lorsque la proposition d’enquête
a été formulée, l’équipe passe à la formulation d’un énoncé des objectifs et elle
approfondit sa compréhension des choix de base de sondage, de la taille générale de
l’échantillon, des besoins de précision, des options de collecte des données, de
l’échéancier et des coûts. La faisabilité de l’enquête est habituellement déterminée à cette
étape.
Lorsque les objectifs de l’enquête sont évidents, chaque membre de l’équipe prépare les
plans de la composante pertinente à sa responsabilité dans l’équipe. Au cours des étapes
ultérieures du processus de l’enquête, les plans sont élaborés, révisés et améliorés, et
des aspects plus détaillés sont examinés. La planification continue pendant tout le
processus de l’enquête et des modifications sont apportées au besoin.

2.2.2. Conception et élaboration

Après avoir établi un grand cadre méthodologique, il est possible d’accomplir un travail
détaillé sur les diverses étapes d’une enquête à la phase intitulée conception et
élaboration. L’objectif général de cette phase est de déterminer l’ensemble des méthodes
et procédures qui permettront d’établir un équilibre approprié entre les objectifs de qualité
et les limites des ressources. Au cours de cette phase, les essais préliminaires ou les
enquêtes pilotes nécessaires sont exécutés pour évaluer, par exemple, si le
questionnaire est approprié, si la base de sondage convient, si les procédures
opérationnelles sont bien choisies, etc. Tout le matériel sur place (p. ex., manuels
d’instruction et de formation des intervieweurs, documents de contrôle des échantillons)
est préparé pour l’étape de la collecte des données. Les programmes logiciels pour les

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 29 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

questionnaires administrés par ordinateur sont élaborés, modifiés ou mis à l’essai. La


touche finale est apportée aux procédures de sélection et d’estimation de l’échantillon
pour établir des spécifications. Les spécifications sur le codage, la saisie des données,
la vérification et l’imputation sont préparées pour le traitement des données. Des
procédures devraient être conçues pour contrôler et mesurer la qualité à chaque étape
de l’enquête par souci d’efficacité (à l’aide de procédures de contrôle qualitatif et
d’assurance de la qualité) et pour évaluer la qualité des produits statistiques en bout de
ligne.

2.2.3. Mise en oeuvre

Après avoir vérifié si tous les systèmes sont en place, l’enquête peut maintenant être
lancée. C’est la phase de la mise en oeuvre. Les manuels et les formules de contrôle de
l’enquête sont imprimés, ainsi que le questionnaire (s’il s’agit d’un questionnaire sur
support papier). Les intervieweurs sont formés, l’échantillon est sélectionné, la collecte
de l’information est faite, et tout est réalisé comme prévu pendant la phase de
l’élaboration. Le traitement des données commence après ces activités. Il comprend la
saisie, le codage, la vérification et l’imputation des données. Le résultat est un ensemble
de données complet bien structuré qui permet de produire les totalisations nécessaires
et d’analyser les résultats de l’enquête. Ces résultats sont ensuite vérifiés aux fins de la
confidentialité puis, diffusés. À chaque étape, la qualité des données devrait être mesurée
et surveillée à l’aide des méthodes conçues et élaborées au cours de l’étape précédente.

2.2.4. Évaluation de l’enquête

L’évaluation est un processus continu au cours de l’enquête. Chaque étape de l’enquête


devrait être évaluée pour déterminer l’efficience, l’efficacité et les coûts, en particulier
dans le cas des enquêtes réitérées, afin d’apporter avec le temps des améliorations à sa
conception et à la mise en œuvre. Ce processus comprend des examens des méthodes
appliquées, ainsi que des évaluations de l’efficacité opérationnelle et de l’efficience.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 30 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Chaque étape de l’enquête est aussi évaluée pour donner un aperçu des lacunes ou des
problèmes à d’autres étapes de l’enquête. La vérification et l’imputation peuvent donner,
par exemple, de l’information sur les problèmes que posent les questionnaires.
Les évaluations d’enquêtes précédentes ou d’enquêtes pilotes sont importantes lors de
la planification d’une nouvelle activité statistique : elles peuvent aider à formuler des
objectifs d’enquête réalistes, donner une idée de la qualité des données que l’on veut
obtenir et de l’information essentielle à la conception de l’enquête et au traitement des
données.

2.3. Instruments de collecte

(questionnaires et guide des entretiens) : comment élaborer les instruments de collecte


et quelles en sont les principales sections.

2.3.1. Questionnaire

Questionnaire : Généralement, la collecte statistique est réalisée au moyen d’un


document appelé questionnaire. Le questionnaire est constitué par un ensemble de
questions judicieusement ordonnées et se rapportant aux informations recherchées.

Si toutes les phases de l’enquête sont importantes et doivent être exécutées avec
beaucoup de soin, la réussite finale de l’enquête est fonction de la nature et de la qualité
des données recueillies. Des données de qualité exigent essentiellement un
questionnaire bien conçu et des procédures uniformes pour le remplir. Le questionnaire
est au coeur du processus de collecte des données. Il a des répercussions importantes
sur la qualité des données parce qu’il constitue le moyen de collecte des données. Il a
aussi des répercussions sur l’image de marque que l’organisme statistique projette dans
le public.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 31 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Les questions posées doivent être conformes à l’énoncé des objectifs de l’enquête et
permettre la collecte d’information utile pour l’analyse des données. Elles doivent
répondre à tous les besoins d’information, mais chaque question devrait avoir une
justification explicite pour être inscrite dans le questionnaire. Il faut savoir pourquoi
chaque question est posée et à quoi servira cette information. La formulation de la
question doit être claire. Les questions doivent être réparties en séquences logiques
pour le répondant. Les questions doivent être formulées pour être faciles à comprendre
et permettre au répondant d’y répondre précisément. Enfin, le questionnaire devrait être
mis à l’essai avant son application, à l’aide de groupes de discussion, d’un prétest et
d’autres méthodes décrites dans ce chapitre.
Le type d’informations que nous obtiendrons lors des entrevues avec les enquêtés
dépendra de la nature des questions que nous leur poserons et de la manière dont
nous les poserons.

La rédaction d’un questionnaire doit répondre à de nombreux critères : les questions


doivent être formulées de façon claire et simple ; elles doivent être ordonnées d’une
façon logique ; elles doivent enfin donner lieu à des réponses précises et objectives.
La longueur du questionnaire et sa facilité d’utilisation sur le terrain sont aussi des
critères importants.
Pour concevoir un questionnaire, il faut respecter les étapes suivantes :

2.3.1.1. Consultation avec les experts du domaine, les utilisateurs des


données et les répondants

Le statisticien ne connait pas tout, mais il est recherché partout. Dans son travail, il est
dans l’obligation de travailler avec des gens qui maitrise le domaine dont il effectue
l’étude. Le processus de consultation avec les utilisateurs des données commence lors
de la formulation des objectifs de l’enquête au cours de la phase de planification et
continue pendant la conception et l’élaboration du questionnaire. Cette consultation

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 32 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

approfondie est particulièrement importante pour les grandes enquêtes, sinon toutes,
d’un organisme statistique. Une compréhension approfondie de l’utilisation des données
devrait permettre à l’organisme statistique d’élaborer un questionnaire bien conçu qui
répond aux besoins des utilisateurs.

Il faudrait consulter non seulement les utilisateurs des données, mais aussi les
répondants, les experts de la matière de l’étude et ceux qui ont procédé à des
enquêtes semblables auparavant, avant de formuler la version provisoire du
questionnaire. Ils devraient pouvoir donner une rétroaction sur le genre d’information que
les répondants peuvent fournir et aider à préciser les concepts à étudier. Rencontrer les
répondants peut aider à identifier les questions et les préoccupations importantes
pour eux et à obtenir des répercussions sur les décisions pertinentes à la matière du
questionnaire. Cette intervention peut aussi aider à identifier les expressions et le
langage qu’utilisent les répondants pour décrire les concepts de l’enquête, et donner
une bonne idée de la façon dont les catégories de questions et réponses devraient
être formulées. Ces discussions peuvent se dérouler pendant des consultations
approfondies ou en groupe de discussion ;

2.3.1.2. Examen des questionnaires précédents

D’autres enquêtes sont une bonne source d’information pour l’élaboration d’une enquête.
L’examen des questions posées dans d’autres enquêtes sur le même sujet ou un sujet
semblable peut être un bon point de départ lorsqu’il faut formuler une question (c.-à-d.
rédiger une question). Lorsque l’on souhaite comparer les résultats de différentes
enquêtes, il est préférable d’utiliser les mêmes questions. Il faudrait aussi examiner la
documentation sur la qualité des données de ces enquêtes pour évaluer l’efficacité du
questionnaire (par exemple, les problèmes de rédaction des questions, le fardeau de
réponse, les taux de refus, etc.).

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 33 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

2.3.1.3 Rédaction de la version provisoire du questionnaire

Il est important de procéder à la mise à l’essai de toutes les versions (c.-à-d. les versions
dans toutes les langues) du questionnaire auprès de répondants bien avant le début de
la « vraie » collecte des données. Répondre à une question est un processus complexe.
Les répondants doivent d’abord comprendre la question. Ils doivent ensuite faire un
effort de mémoire ou fouiller des dossiers pour extraire l’information demandée. Ils
doivent aussi réfléchir à la réponse exacte à la question et déterminer s’ils sont disposés
à révéler l’information, en tout ou en partie. Ils répondent alors à la question. Chacun de
ces processus peut être une source d’erreur.

2.3.1.4 Examen du questionnaire auprès des utilisateurs des données

Il est important de partager la version provisoire du questionnaire aux utilisateurs des


données afin recueillir leurs appréciations et suggestions pour son enrichissement. Les
méthodes usuelles pour l’examen des questionnaires par les utilisateurs sont les ateliers
de validation des outils de collecte au cours desquels les commentaires et les
suggestions sont jaugés par l’ensemble des participants assortis des recommandations
relatives aux commentaires et suggestions retenus de commun accord pour être prise en
compte par l’équipe de pilotage de l’enquête.

2.3.1.5 Mise à l’essai et révision du questionnaire

Les méthodes appliquées aux mises à l’essai des questionnaires (matière, présentation,
etc.) sont habituellement axées sur de petits échantillons subjectifs non probabilistes de
répondants tirés de la population cible. Voici les méthodes décrites dans les sections
suivantes :
Prétest : Le prétest (parfois intitulé essai préliminaire) est facile, le coût est raisonnable,
et c’est une étape fondamentale de l’élaboration d’un questionnaire. S’il n’y a pas d’autres
mises à l’essai du questionnaire, il faudrait au moins faire un prétest. La taille de
l’échantillon du prétest peut varier de 20 à 100 répondants ou plus. Si le principal objectif

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 34 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

est de repérer des problèmes de rédaction ou de séquence, très peu d’interviews sont
nécessaires. Il faut en faire davantage (de 50 à 100) pour déterminer les catégories de
réponse aux questions fermées, à partir des réponses aux questions ouvertes du prétest.
Lors du prétest, le répondant n’est pas informé, il remplit simplement le questionnaire ou
répond à l’interview pour refléter la situation lors de la collecte réelle des données. Le
prétest indique seulement là où il y a un problème. Sans aller plus loin, il ne détermine
pas pourquoi il y a un problème ou comment le corriger. La mise à l’essai non officiel
n’identifiera peut-être pas non plus tous les problèmes du questionnaire.
Voici à quoi sert le prétest d’un questionnaire : découvrir l’ordre ou la rédaction
médiocres des questions, corriger des sauts, fermer certaines questions ouvertes,
retrouver les modalités manquantes (NSP), reconnaitre les problèmes des non réponse
(ne veut pas répondre) et des hors-champs (ne peut pas répondre), estimer la longueur
d’un questionnaire, repérer les erreurs de présentation ou d’instructions du questionnaire.

Groupes de discussion : Au cours des premières étapes de l’élaboration du


questionnaire, les groupes de discussion peuvent aider à identifier les questions
saillantes de la recherche. On fait appel à eux pour évaluer la compréhension du langage
et de la rédaction des questions et des instructions de la part du répondant, ainsi que
d’autres formulations et mises en forme des questions. Un animateur qui connaît bien les
techniques d’interview des groupes et l’objectif de la discussion oriente le groupe de
discussion. Chaque groupe comprend habituellement de six à douze personnes et la taille
optimale est de sept à neuf personnes. Une séance en groupe de discussion demande
habituellement deux heures environ. Le groupe de discussion est enregistré sur bande
sonore (et parfois sur bande vidéo) que les observateurs peuvent entendre dans une
salle derrière un miroir d’observation. Il est recommandé que ceux qui élaborent le
questionnaire observent le groupe de discussion. Les observateurs n’interviennent
pas dans la discussion du groupe, mais leurs observations peuvent servir à
l’animateur à la fin de la séance du groupe de discussion.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 35 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Essai pilote : Une enquête pilote se déroule pour observer toutes les étapes du
processus de l’enquête, y compris l’administration du questionnaire. Une enquête pilote
est une « simulation » qui applique la version finale du plan d’enquête à petite échelle du
début à la fin, y compris le traitement et l’analyse des données. Elle permet à l’organisme
statistique de considérer les résultats du questionnaire pendant toutes les étapes de
l’enquête (collecte, vérification, imputation, traitement, analyse des données, etc.). Le
questionnaire est habituellement soumis à des essais approfondis à l’aide des méthodes
susmentionnées avant l’enquête pilote.

2.3.1.6. Touche finale apportée au questionnaire

La conception du questionnaire est un processus itératif : des modifications sont


continuellement apportées pendant l’élaboration et la mise à l’essai du questionnaire. Les
objectifs et les besoins d’information sont formulés et réévalués, les répondants et les
utilisateurs des données sont consultés, la version préliminaire des questions proposées
est formulée et mise à l’essai, les questions sont examinées et révisées jusqu’à la
formulation de la version finale du questionnaire. Lorsqu’il est décidé qu’il n’y aura pas
d’autres modifications apportées au questionnaire, l’étape finale du processus est
franchie. La touche finale est alors apportée au questionnaire et il est imprimé ou
programmé, selon la méthode de saisie des données appliquée.
Une autre décision dans la conception d’un questionnaire concerne le type de réponse
qu’il faut associer à chaque question : une réponse libre pour une question ouverte et
une réponse imposée pour une question fermée.

2.3.1.7. Question ouverte

La formulation d’une question ouverte laisse au répondant toute la latitude pour


construire librement sa réponse, avec ses propres mots et spontanément : aucune
réponse lui est imposée. L’usage d’une question ouverte s’impose dans différents cas de
figure :

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 36 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

- Quand le contenu issu de la spontanéité constitue même l’objet de l’information


recherchée. C’est le cas pour une étude qui veut savoir si les répondants ont une
bonne connaissance sur un problème, par exemple ;

- Lorsque la diversité des réponses est beaucoup plus étendue pour établir une liste
exhaustive des modalités de la question (la profession d’une personne);

- Quand on n’est pas sûr de connaitre toutes les réponses possibles à la question.

Les différentes formes des questions ouvertes sont :


- Question à réponse textuelles : quel est le plus important problème au Congo ?

- Question à réponse numérique : Au cours des 12 derniers mois, combien de véhicules


avez-vous lavés ?

2.3.1.8. Question fermée

La formulation d’une question fermée contient les modalités de réponses attendues


entre lesquelles le répondant doit impérativement choisir. Sa rédaction implique donc que
l’analyste connaisse les réponses qui peuvent être données et qu’il sélectionne celles qui
l’intéressent en regard des objectifs de l’étude.

Il existe plusieurs types de questions fermées :


- Question dichotomique : La question dichotomique est la version la plus simple d’une
question fermée. Il s’agit souvent d’une question qui n’a que deux réponses possibles
(oui/non, pauvre/non pauvre, masculin/féminin, etc.) ;

- Question à choix unique : c’est une question qui demande au répondant de ne choisir
qu’une seule réponse dans la liste.

Exemple : Quel est le réseau téléphonique que vous utilisez le plus quand vous appelez
à l’étranger ? (MTN, Airtel, Azur, Congo Telecom, NSP) ;

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 37 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

- Questions à choix multiples: c’est une question qui demande au répondant de choisir
au moins une réponse dans la liste.

Exemple : quels sont les réseaux téléphoniques que vous utilisez ? (MTN, Airtel, Azur,
Congo Telecom) ;

- Question avec classement (ou à réponse ordonnée) : La question avec classement est
un autre genre de question fermée et elle demande au répondant d’établir l’ordre des
catégories de réponse, par exemple : ¨Quelles sont, selon vous, les priorités au Congo ?
Veuillez les classer par ordre de priorité en inscrivant « 1 » à la réponse qui serait la plus
utile, selon vous, « 2 » à la méthode qui serait la plus utile en second lieu, et ainsi de
suite. (lutte contre le chômage, lutte contre la pauvreté, lutte contre l’inflation, lutte contre
les inégalités, la santé, l’éducation, l’autosuffisance alimentaire).

2.4. Aspects juridiques des enquêtes statistiques

2.4.1. Le Conseil National de la Statistique (CNS)

Le Conseil National de la Statistique (CNS) est l’organe de régulation du Système


Statistique National (SSN). Son organisation et son fonctionnement ont été définis par la
loi n°99-014 du 12 avril 2000. Il a pour mission de proposer au Gouvernement les
orientations générales de la politique de gouvernance statistique de la Nation, les priorités
en matière de collecte, de traitement et de diffusion de l’information statistique ainsi que
les instruments de coordination des activités du Système Statistique National (SSN).

Le Conseil National de la Statistique (CNS) regroupe en son sein toutes les autorités
statistiques et des représentants de la société civile tels les universitaires, les syndicats

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 38 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

et les ONG. Sa présidence est assurée par le Ministre en charge de la Statistique,


actuellement Ministre du Développement, de l’Analyse Economique et de Prospective et
son secrétariat par l’Institut National de la Statistique et de l’Analyse Economique
(INSAE).

Le fonctionnement du CNS
Le CNS comprend de trois (3) commissions techniques:

• la Commission du Programme des Enquêtes, Etudes et Traitement (CPEET) ;


• la Commission de la Normalisation, des Nomenclatures et des Codes (CNNC) ;
• la Commission de la Formation et de l’Utilisation des Cadres Statisticiens,
Démographes et Informaticiens (CFUCS).

De façon statutaire, chacune des commissions spécialisées du CNS se réunit deux (2)
fois par an en sessions ordinaires en prélude aux deux (2) sessions ordinaires du Conseil
National de la Statistique (CNS). Une session ordinaire de chaque commission
spécialisée et du CNS s’organise une fois par semestre. Pour le premier semestre entre
février et mars, et pour le second semestre entre septembre et octobre. Des sessions
extraordinaires de la CPEET sont organisées lorsque des demandes de visa sont
sollicitées, par les différentes structures du Système Statistique National, pour la
réalisation d’enquêtes et d’études.

Les attributions des commissions du CNS


La Commission du Programme des Enquêtes, des Etudes et du Traitement (CPEET) est
chargée de :

• examiner les activités d’enquêtes, d’études et de traitement de l’information


inscrites dans les projets de programmes statistiques pluriannuels et Annuels ;
• instruire les demandes d’attribution du visa statistique ;
• examiner les documents soumis au CNS relevant de sa compétence ;
• formuler toute recommandation utile dans ses domaines de compétence.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 39 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

La Commission de la Normalisation, des Nomenclatures et des Codes (CNNC) est


chargée de :

• adopter les concepts, définitions, nomenclatures et codes ainsi que les


méthodologies utilisés par les autorités statistiques ;
• examiner les documents soumis au CNS relevant de sa compétence ;
• formuler toute recommandation utile dans ses domaines de compétence.

La Commission de la Formation et de l’Utilisation des Cadres Statisticiens, Démographes


et Informaticiens (CFUCS) est chargée de :

• examiner les projets relatifs à la formation initiale et à la formation continue du


personnel du Système Statistique National en veillant notamment au respect des
standards internationaux dans le domaine de la formation des statisticiens ;
• examiner les activités relatives à la mise en œuvre des projets mentionnés ci-
dessus dans le cadre de l’élaboration des programmes statistiques pluriannuels et
Annuels ;
• examiner les cas de violation du secret statistique par des membres du personnel
du Système Statistique National ;
• examiner les documents soumis au CNS relevant de sa compétence ;
• formuler toute recommandation utile dans ses domaines de compétence.

2.4.2. Le visa statistique

Conformément à l’article 4 de la loi statistique, toute enquête par sondage, recensement


ou étude statistique ou socio-économique nécessitant la collecte de données auprès de
tiers, menés par des services publics ou parapublics et des organismes internationaux à
l’exclusion des travaux statistiques internes, doit obtenir une autorisation préalable ou
visa statistique avant son exécution. Ce visa ne peut être accordé qu’à l’une au moins
des conditions ci-après :

• l’enquête s’inscrit dans le cadre du programme statistique annuel ;


• l’enquête est prévue par une loi spéciale ;
• l’enquête présente un caractère de nécessité et d’urgence indiscutables ;
• l’enquête ne constitue pas un double emploi.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 40 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

La demande d’attribution de visa doit être accompagnée des documents techniques


suivants :

• le document méthodologique (Contexte et justification de l’étude ou de l’enquête,


objectifs général et spécifiques, résultats attendus, méthodologie
d’échantillonnage, organisation de la collecte, mode de traitement et plan
d’analyse) ;
• les questionnaires ;
• les manuels d’instructions aux enquêteurs / contrôleurs / superviseurs ;
• le plan de sensibilisation ;
• le chronogramme d’exécution des opérations ;
• le budget estimatif des opérations de terrain ;
• le plan de diffusion des résultats.

Chacun de ces documents doit être fourni en trente (30) exemplaires.

Le secrétariat du Conseil National de la Statistique est tenu de donner une réponse au


demandeur de visa dans un délai d’un mois à compter de la date de réception de sa
requête. Passé ce délai, le visa est supposé accordé de droit.

Les résultats des enquêtes ayant obtenu le visa doivent déposés au secrétariat du
Conseil National de la Statistique.

Article 22. En cas d’exécution sans visa d’enquêtes statistiques devant être soumises à
l’obtention d’un visa conformément aux dispositions de l’article 5, le secrétariat du Conseil
National de la Statistique demande de surseoir au déroulement de l’opération.

Les résultats des enquêtes statistiques réalisées sans le visa préalable du Conseil
National de la Statistique sont frappés de nullité et ne pourront être utilisés que si une
procédure de régularisation a conduit à son homologation.

Les données collectées en dehors de la procédure sus-évoquée sont nulles sauf à être
régularisées pour être homologuées d’après la loi. En cas de données collectées sans

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 41 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

autorisation et portant préjudice aux intérêts du pays, les auteurs sont passibles de
sanctions selon l’article 22 de la même loi :
– la personne physique l’ayant réalisée est punie d’une peine d’emprisonnement de six
(6) mois à deux (2) ans et d’une amende de deux cent mille (200 000) francs à deux
millions (2 000 000) de francs ou de l’une de ces deux peines ;
– la personne morale l’ayant réalisée sera punie d’une amende de cinq cent mille (500
000) francs à cinq millions (5 000 000) de francs et son établissement fera l’objet d’une
fermeture provisoire pour une durée de trois (3) à six (6) mois ou de l’une de ces deux
peines. En cas de récidive les peines sont portées au double.

2.4.3. Consentement éclairé et secret statistique

DES PRINCIPES D'ETHIQUE DE LA RECHERCHE EN SANTE Article 6 Loi N° 2010-40


du 08 décembre 2010 : Toute recherche impliquant des sujets humains doit être exécutée
dans le respect des principes ci-après: -la dignité humaine et les droits de l'homme; -la
vulnérabilité humaine et l'intégrité personnelle; - l'anonymat; - la confidentialité; - les
croyances et les pratiques socio-culturelles ; - l'innocuité; - l'action bénéfique de la
recherche; - l'équité de la recherche; - la restitution des résultats aux personnes
concernées; - les règles de diffusion et d'utilisation des résultats; - le partage des bienfaits
de la recherche.

L'implication d'êtres humains, en tant qu'objets de recherche, doit être subordonnée à la


possibilité pour eux d'y consentir librement et en toute connaissance de cause. Ces
personnes ont la latitude de se soustraire du programme de recherche à n'importe quel
moment sans crainte ni menace.

Article 25 de la loi n°99-014 du 12 avril 2000 : Les renseignements individuels portés sur
les questionnaires d’enquête revêtus du visa prévu à l’article 4 de la présente loi, sont
couverts du sceau du secret statistique. Les résultats ne peuvent être publiés que sous

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 42 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

forme anonyme. Le secret statistique est opposable aux personnes physiques ou


morales, privées ou publiques participant à quelque titre que ce soit aux enquêtes.

Il est interdit aux agents des services publics et des organismes participant aux enquêtes
de divulguer de quelque manière que ce soit les renseignements visés à l’alinéa 1er du
présent article ou d’en donner connaissance à quiconque ;
Les renseignements considérés ne pourront en aucun cas être utilisés à des fins de
contrôle fiscal ou de répression de quelque nature que ce soit.

Les infractions aux dispositions du présent article seront punies conformément aux
dispositions du code pénal relatives à la violation du secret professionnel.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 43 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

III. Thème 3 : Traitement et analyse des données

3.1. Traitement des donnés

Le traitement des données englobe la codification, la saisie, l’apurement et la tabulation.


Les questionnaires collectés ne peuvent être analysés sans la constitution préalable et le
traitement d’un fichier des données informatiques. Ce traitement dépend aussi bien du
mode de collecte (questionnaire papier, Internet… auto-administré ou par enquêteur-
trice) que des analyses que l’équipe technique de l’enquête souhaite effectuer eu égards
aux objectifs poursuivis.

3.1.1. Les modes de saisie

Il existe plusieurs modes de saisie possibles.


La saisie par opérateur-trice des questionnaires papier : Ce mode de saisie, utilisé
depuis des lustres, consiste à faire saisir les questionnaires papier par des opérateur-
trice-s grâce à une application.
La méthode CAPI (Computer-assisted personal interviewing) : Dans ce type de
méthode, l’enquêteur-trice se déplace chez l’enquêté-e avec un ordinateur portable ou
une tablette et saisit les réponses directement lors de l’entretien.
La saisie optique : L’utilisation d’un tel système demande une mise en forme graphique
du questionnaire particulière. La saisie optique est rapide pour les questions fermées
(cases cochées et chiffres), mais les questions ouvertes sont généralement saisies à la
main par opérateur-trice-s. Après la saisie, les questionnaires sont disponibles sous
forme numérique et peuvent être indexés dans une base de données et consultés plus
rapidement que les questionnaires papier.
La saisie par internet : Les questionnaires sont mise par Internet selon la méthode
CAWI (Computer-assisted web interviewing). L’enquêté-e va sur la plateforme dédiée à
l’enquête, sélectionne/ouvre le questionnaire le concernant et saisit ses réponses lui-
même.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 44 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

La méthode CATI (Computer-assisted telephone interviewing) : Pour certaines enquêtes,


les structures ayant pas l’infrastructure matérielle requise recoure à la méthode
téléphonique pour la passation et la saisie des questionnaires. Ce type de collecte a
connu un essor en Afrique à la suite de la pandémie de la COVID 19.

3.1.2. Le codage

Le codage des questionnaires est une étape souvent nécessaire lors de la production du
fichier informatique de l’enquête, qui consiste à attribuer des codes pertinents aux
réponses en vue de faciliter leur traitement ultérieur lors des analyses. La phase de
codage peut intervenir soit en amont de la saisie, soit pendant, soit après. Il faut tenir
compte du type d’analyse qui devra être réalisée par la suite : en effet, certaines analyses
requièrent la présence d’informations ou le codage particulier de questions qui ne sont
pas nécessairement en relation directe avec l’objet de l’enquête.

Certaines questions demandent un traitement particulièrement complexe pour leur


codification. C’est le cas des professions pour lesquelles il peut être fait appel à des
logiciels spécialisés tels que le logiciel SICORE développé par l’INSEE France. Ce type
de codification peut avoir des incidences sur la conception du questionnaire, dans la
mesure où il peut être nécessaire d’inclure des questions précisant l’activité de la
personne.

Diverses sortes de codes sont à disposition de l’équipe technique. Le plus simple est le
code numérique : il attribue des nombre consécutifs aux catégories. Ce nombre peut être
nominal dans le cas où l’on veut, par exemple, identifier une situation de familles :
Code Catégories
1 célibataire
2 marié
3 veuf

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 45 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

4 divorcé
Il peut être ordinal, si l’on veut, par exemple, affecter un nombre à chaque groupe d’âge
:
Code Catégories
1 moins de 19 ans
2 20-39 ans
3 40-64 ans
4 65 ans et plus

Existent également les codes numériques non-consécutifs. En géographie, cette situation


se présente fréquemment car les unités administratives ou politiques ont souvent des
identificateurs déjà attribués par l’organisme de recensement ; par exemple, les divisions
administratives du recensement général de la population et de l’habitat fixés par l’INSAE.
Le code alphabétique est parfois utilisé et peut être de nature nominale ou ordinale. Par
exemple, on peut coder le sexe de la personne par la lettre M pour masculin et F pour
féminin ; dans le cas de l’échelle ordinale, on pourrait identifier les groupes d’âge de la
façon suivante :
Code Catégories
J moins de 19 ans
JA 20-39 ans
A 40-64 ans
V 65 ans et plus
Un autre type utilisé est celui des codes de classification à identifications multiples. C’est
une forme de codage détaillé : un code spécifique est utilisé pour la catégorie et un autre
pour la sous-catégorie. On peut également avoir recours à des codes mixtes comme dans
l’exemple suivant :
Code Catégories

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 46 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

1 masculin, célibataire
2 masculin, marié
3 femme, célibataire
4 femme, mariée
Un dernier exemple, et peut-être le cas le plus fréquent, est le code dichotomique ou
binaire, celui où la question implique seulement deux possibilités de réponses : par
exemple, une réponse affirmative (oui = 1) ou une réponse négative (non = 2).

3.1.3. L’apurement

L’apurement est une étape lors de laquelle le fichier de données de l’enquête subit une
multitude de contrôles et de tests de cohérence afin d’en améliorer la qualité. Cette étape
se déroule très souvent après la saisie des questionnaires, mais quand la période de
saisie est longue (plusieurs mois), elle peut avoir lieu durant cette dernière.

Les contrôles effectués lors de l’apurement sont de plusieurs types :

Les tests de cohérence : Les tests de cohérence permettent de déceler dans les
données des erreurs de saisie, des incohérences dans les déclarations des enquêté-e-s
mais également de vérifier la cohérence de situations difficiles à repérer lors de la saisie
ou de la relecture des questionnaires.

Contrôle de validité des filtres : Les questionnaires d’enquête contiennent un certain


nombre de filtres dont l’objet est de ne poser que les questions qui concernent l’enquêté-
e.

3.1.4. Tabulation

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 47 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Le résultat principal que l’on attend d’une enquête est bien évidemment la fourniture d’un
certain nombre de tableaux statistiques résumant l’information recueillie. Ces tableaux
sont choisis et dessinés par le statisticien et réalisés selon un processus particulier par
l’informaticien qui écrit à cet effet un programme de tabulation.

Les tableaux produits lors de la tabulation sont de plusieurs types :


Tableaux à double entrée : Il peut s’agir de tableaux d’effectifs, de pourcentages ou de
fréquence, de quantités ou de moyennes.

Tableaux statistiques à multiples entrées : Il s’agit de tableaux faits sur plusieurs


niveaux hiérarchiques avec au moins trois critères.

Organisation de la production des tableaux : Il convient d’organiser la production en


3 temps. D’abord les tableaux urgents et prioritaires en petit nombre, qui permettent de
faire un premier point sur la qualité de l’enquête. Puis les tableaux intermédiaires ou de
travail qui peuvent servir à définir de nouvelles variable (confection de tranches pour des
variables quantitatives, regroupement des nomenclatures….). Enfin les tableaux définitifs
qui ne seront commandés qu’après vérification rigoureuse des deux premières séries. Ce
système permet de tester la bonne compréhension entre le Statisticien et l’Informaticien,
de déceler des erreurs ou les incohérences de fichiers. Les modifications éventuelles
peuvent alors être apportées.

Les résultats d’une enquête doivent être compilés par tabulations manuelles ou par
ordinateur. Dans ce dernier cas, on procède au stockage sur support informatique du
fichier hiérarchisé traitable par un logiciel de tabulation. On évite la production d’un grand
nombre de tableaux en ayant recours à une production à la demande. On peut aussi
stocker des tableaux eux-mêmes en vue d’une utilisation ultérieure.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 48 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Définition d’un tableau : Pour définir un tableau, il faut se fixer le niveau hiérarchique
c’est-à-dire la population concernée. Le tableau étant caractérisé par le croisement de 2
ou plusieurs critères ou par un critère, la population à ventiler correspond au niveau
hiérarchique le plus faible concernant les critères. Ces derniers sont appelés critères de
ventilation.
On peut aussi spécifier une sous-population qui sera seule concernée par le tableau. On
définit cette sous-population par des critères d’appartenance liés entre eux par une
condition logique et prenants des modalités définies.

3.2. Analyse descriptive

Lorsqu’on a des données, on peut faire deux sortes d’analyses à savoir : l’analyse
descriptive et l’analyse inférentielle ou explicative. L'analyse descriptive des données
permet de résumer un ensemble de données brutes à l'aide de techniques statistiques.
Ce type d'analyse vise essentiellement à décrire les caractéristiques d'un échantillon et
à répondre aux questions de recherche (Fortin et Gagnon, 2015).

Les statistiques descriptives comme le nom l’indique servent à analyser et décrire des
données pour obtenir un rendu final. Ce sont de simples calculs mathématiques qui
permettent de dégager des données une réelle tendance positive ou négative des
résultats. A partir de ces chiffres, des graphiques viennent en complément pour appuyer
l’analyse statistique.

Il s'agit de critères qui quantifient différentes caractéristiques de la distribution des


observations :
• sont-elles centrées autour d'une valeur ?
• sont-elles groupées autour de certaines valeurs ?
• parcourent-elles de larges plages de valeurs possibles ?

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 49 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

• suivent-elles des lois statistiques connues?


• etc.

3.2.1. Description intrinsèque d’une distribution d’observations

Sans aucun a priori sur la question que l'on se pose, quelques statistiques simples
permettent de la décrire : le tableau de fréquence, la moyenne, la médiane, le mode, le
maximum, le minimum, l'écart type (et la variance), les quartiles. Les deux premiers
sont souvent nommés critères de position, et les autres entrent plutôt dans la catégorie
des critères de dispersion.

Moyenne : La moyenne arithmétique est la somme des valeurs de la variable divisée par
le nombre d'individus.

Médiane : La médiane est la valeur centrale qui partage l'échantillon en 2 groupes de


même effectif : 50 % au-dessus et 50 % en dessous. La médiane peut avoir une valeur
différente de la moyenne. En général, une médiane est, dans une série ordonnée, une
valeur M telle qu'il y ait autant de valeurs supérieures ou égales à M que de valeur
inférieures ou égales à M. exemple : 1 3 5 7 9 la médiane est 5.

Mode : Le mode correspond à la réalisation la plus fréquente. Le mode d'une série, ou


dominante d'une distribution, est la valeur de la variable (ou de l’unité statistique) qui
revient le plus fréquemment dans la série. C'est la valeur centrale de la classe qui a le
plus grand effectif. Soit la série {8,4,4,3,4,3,8,2,5}, la valeur la plus fréquente de cette
série est 4. Le mode est donc égal à 4. L'effectif associé à ce mode est 3.
Le mode est l'indice le plus simple à déterminer puisqu'il suffit de lire un graphique ou de
regarder le tableau des effectifs.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 50 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Variance : La variance est la simple moyenne arithmétique des carrés des écarts à la
moyenne arithmétique observée.

Ecart-type : C'est la racine carrée de la variance.

Étendue : C'est l'intervalle entre la plus petite et la plus grande valeur. On dit d'un
phénomène qu'il présente une « forte dynamique » lorsque l'étendue (ou la dispersion)
est grande.

Quantiles : Les quantiles est une généralisation de la notion de médiane qui divise la
distribution en deux parties égales. On définit notamment les quartiles, déciles et centiles
(ou percentiles) sur la population, ordonnée dans l'ordre croissant, que l'on divise en 4,
10 ou 100 parties de même effectif. On parlera ainsi du « centile 90 » pour indiquer la
valeur séparant les premiers 90 % de la population des 10 % restants. Ainsi, dans une
population de jeunes enfants, un enfant dont la taille est au-delà du centile 90, ou en deçà
du centile 10, peut être l'objet d'un suivi particulier.

Etude de plusieurs variables : Le principe est le même que pour une seule variable,
sauf que toutes les caractéristiques (moyenne, mode, écart type, etc) sont bi variées (des
vecteurs). Il y a d'autre part une caractéristique supplémentaire : la corrélation. Elle est
une mesure linéaire de la dépendance entre les différentes composantes de la variable
multi variée.
Il existe d'autres mesures de dépendance entre deux variables, comme l'information
mutuelle (ou l'entropie conditionnelle).

Au-delà des mesures, on peut aussi explorer les dépendances à l'aide d'outils graphiques
ou de tableaux.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 51 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

3.2.2. Visualisation graphique d’une distribution d’observations

3.2.2.1. Visualiser la distribution d’une variable catégorielle

Un graphique à barres est souvent utilisé pour visualiser le nombre d’observations


dans chaque catégorie; dans notre exemple, le nombre d’arbres par espèce.

Pour mettre l’accent sur les proportions des observations par catégorie, on utilise
parfois un graphique circulaire (pie chart).

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 52 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

En général, les graphiques circulaires sont déconseillés. Ils deviennent difficiles à lire
lorsque le nombre de catégories augmente. Aussi, il est plus facile visuellement d’estimer
une longueur qu’une surface; autrement dit, on peut mieux comparer les grandeurs
lorsqu’elles sont représentées sur une dimension (comme dans le graphique à barres)
que sur deux dimensions.

Cela dit, le graphique circulaire peut être utile lorsqu’on veut comparer les proportions à
des fractions simples comme 1/2 ou 1/4. Par exemple, on voit ici que plus de 50% des
arbres font partie des deux espèces les plus communes, TSCA (pruche du Canada) et
ACRU (érable rouge).

Pour une variable nominale, les catégories n’ont pas d’ordre fixe. En les ordonnant
d’après leur fréquence, comme on l’a fait ici, on simplifie la lecture du graphique. Pour
une variable ordinale, il faut bien sûr respecter l’ordre des valeurs de la variable.

3.2.2.2. Visualiser la distribution d’une variable numérique continue

Un histogramme est obtenu en comptant le nombre d’observations dans des intervalles


de taille égale sur l’axe de la variable observée. Ci-dessous, l’histogramme du DHP
montre clairement l’asymétrie de la distribution (plusieurs arbres de petit diamètre et de
rares arbres avec un très grand diamètre). On remarque aussi que l’inventaire comporte
un DHP minimum autour de 10 cm.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 53 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

L’approximation de la distribution par un histogramme dépend du choix de la taille de


l’intervalle (bin width en anglais), donc il est utile de tester plusieurs valeurs. Avec des
intervalles trop grands, on perd de l’information sur les variation de fréquence à petite
échelle; avec des intervalles trop petits, on obtient une distribution trop irrégulière par
manque de données dans chaque intervalle.

Le graphique de densité utilise quant à lui une méthode d’estimation par noyau (kernel
density estimation) pour approximer la distribution de probabilité continue à partir des
observations. Comme pour l’histogramme, le graphique de densité comprend un
paramètre qui détermine la résolution du graphique sur l’axe des x, allant d’une
distribution plus lisse à une plus irrégulière.

3.2.2.3. Statistiques sommaires d’une variable numérique continue : Moyenne,


variance et écart-type

Prenons une série de données x1, x2, …, xn provenant de n observations d’une variable
numérique x.
La moyenne de x est notée 𝑋̅ et définie comme :
𝑛
∑𝑖=1 𝑋𝑖 𝑘
∑𝑖=1 𝑛𝑖 𝑋𝑖
𝑋1+𝑋2+⋯𝑋𝑛
𝑋̅ = = = ∑𝑘
𝑛 𝑛 𝑖=1 𝑛𝑖

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 54 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

La moyenne constitue en quelque sorte le “centre de gravité” d’une distribution: si chaque


observation exerçait un poids proportionnel à sa distance de la moyenne, ces poids
seraient en équilibre.

Par cette définition, si on soustrait x¯x¯ de chaque observation pour obtenir son écart à
la moyenne, la somme de ces écarts est égale à zéro.

Pour mesurer le degré de dispersion des données autour de leur moyenne, on prend le
carré des écarts à la moyenne. La moyenne de ces écarts au carré se nomme la variance,
notée :
∑𝑘𝑖=1 𝑛𝑖 (𝑋𝑖 − 𝑋̅)2
𝜎𝑋2 =
∑𝑘𝑖=1 𝑛𝑖
L’unité de mesure de la variance diffère de celle des données (ex.: pour un diamètre en
cm, la variance est en 𝑐𝑚2 ). Pour cette raison, il est utile de rapporter non pas la variance
comme telle, mais plutôt sa racine carrée, ou écart-type (σ)

∑𝑘𝑖=1 𝑛𝑖 (𝑋𝑖 − 𝑋̅)2


𝜎𝑋 = √
∑𝑘𝑖=1 𝑛𝑖

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 55 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Comme la moyenne et l’écart-type ont les mêmes unités, on peut calculer leur ratio pour
obtenir une mesure de la dispersion relative des données. Ce ratio est
nommé coefficient de variation (CV) et s’exprime généralement en pourcentage.

𝜎𝑋
𝐶𝑉 (𝑒𝑛 %) =
𝑋̅

Dans notre jeu de données, l’ensemble des arbres a un DHP moyen de 21.8 cm, avec
un écart-type de 12.3 cm (CV de 56%). Nous ajoutons un point à l’histogramme pour
représenter la moyenne et une ligne correspondant à un écart-type de chaque côté de la
moyenne. Notez que si la moyenne et l’écart-type donnent une certaine idée de la
distribution des valeurs, d’autres informations telles que l’asymétrie de la distribution sont
perdues.

3.2.2.4. Statistiques de rang

D’autres statistiques sommaires courantes sont basées sur le rang des observations,
lorsque celles-ci sont classées en ordre croissant. Celles-ci incluent :

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 56 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

• le minimum et le maximum;

• la médiane: définie comme l’observation de rang central, ou pour un nombre pair


de données, la moyenne des deux observations centrales;

• les quantiles.

Les quantiles peuvent être vus comme une généralisation de la médiane. Si la médiane
divise les données en deux groupes contenant le même nombre d’observations, d’autres
types de quantiles divisent les données en plus de deux groupes. Les types de quantiles
les plus utilisés sont les quartiles (4 groupes), quintiles (5 groupes), déciles (10 groupes)
ou centiles (100 groupes).

En particulier, les quartiles servent à définir un graphique nommé boîte à


moustaches (boxplot).

3.2.2.5. Boîte à moustaches

Popularisé par Tukey, ce graphique permet de visualiser la position des quartiles (incluant
la médiane). La boîte située entre le 1er et le 3e quartile représente la région contenant
50% des observations. La distance entre le 1er et le 3e quartile se nomme l’écart
interquartile (ou IQR pour interquartile range). Une moustache montre l’étendue des
données de chaque côté de la boîte.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 57 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Souvent, la longueur maximale de chaque moustache est déterminée par l’écart


interquartile (1.5 fois l’IQR, selon la convention de Tukey). Les valeurs extrêmes au-delà
de cette limite sont représentées par des points.

En juxtaposant l’histogramme du DHP et la boîte à moustaches, on voit que cette dernière


représente bien les caractéristiques essentielles de la distribution, incluant l’asymétrie, le
DHP minimal et la présence de quelques très grands arbres.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 58 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Par rapport à la moyenne et l’écart-type, les statistiques basées sur les quantiles sont
moins sensibles aux valeurs extrêmes. Voyons ce qu’il arrive si nous supprimons les
données des 18 arbres (sur plus de 1100) avec un DHP supérieur à 65 cm.

L’exclusion de ces quelques grands arbres affecte davantage la moyenne (diminution de


4%) et l’écart-type (diminution de 16%) que la médiane (diminution de 1%) et l’écart
interquartile (diminution de 2%). Rappelons-nous que le poids d’une observation sur la
moyenne dépend de sa distance à cette dernière. Comparativement, la médiane dépend
seulement du nombre d’observations plus petites ou plus grandes, mais pas de leur
distance.

Si la boîte à moustaches représente une distribution de manière très simplifiée, cette


simplicité peut représenter un avantage lorsqu’on souhaite visualiser de nombreuses
distributions côte-à-côte. Par exemple, nous illustrons ci-dessous la distribution du DHP
des principales espèces d’arbres à Kejimkujik. On remarque tout de suite que le DHP des

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 59 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

bouleaux blancs est moins variable et distribué plus symétriquement que celui des autres
espèces.

3.2.2.6. Résumé – Statistiques d’une variable

Variables numériques

• Visualiser la distribution: boîte à moustaches, histogramme, graphique de densité

• Mesures de tendance centrale: médiane, moyenne

• Mesures de dispersion: étendue (max - min), écart interquartile, écart-type

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 60 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

• Pour des séries de données à différentes échelles, on peut comparer la dispersion


relative en calculant le coefficient de variation (ratio de l’écart-type sur la moyenne,
souvent exprimé en %).

Variables catégorielles

• Visualiser la distribution: graphique à barres.

• Variable nominale: Comme tendance centrale, on peut seulement définir


le mode (valeur la plus commune).

• Variable ordinale: Puisque les catégories sont ordonnées, on peut aussi définir la
valeur médiane.

3.3. Analyse de deux variables

La relation entre deux variables peut être visualisée à l’aide de trois type de graphiques.
Consommation de cigarettes des
collégiens selon le sexe

EFFECTIF TOTAL 24
10
14
≥ 1 CIGARETTE/JOUR 5
2
3
< À 1 CIGARETTE/JOUR 3
1
2
0 CIGARETTE PAR JOUR 16
7
9
0 5 10 15 20 25 30
Nombre de collégiens

Total Filles + Farçons Garçons Filles

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 61 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Consommation de cigarettes des


collégiens selon le sexe
30

Nombre de collégiens
25
20
15
10
5
0
0 CIGARETTE PAR <À1 ≥1 EFFECTIF TOTAL
JOUR CIGARETTE/JOUR CIGARETTE/JOUR

Filles Garçons Total Filles + Farçons

Consommation de cigarettes des


collégiens selon le sexe
30
Nombre de collégiens

25
20
15
10
5
0
0 CIGARETTE PAR <À1 ≥1 EFFECTIF TOTAL
JOUR CIGARETTE/JOUR CIGARETTE/JOUR

Filles Garçons Total Filles + Farçons

L’analyse graphique de la dépendance entre les deux variables est complétée par le
recours au test de Khi-2 (cas de 2 variables qualitatives) ou test d’analyse de la variance
appelé test de Fisher (cas d’une variable qualitative et une variable quantitative). Ces
deux tests sont présentés dans la section 3.5 consacré au tests statistiques.

3.4. Analyse explicative

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 62 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

3.4.1. Relation entre deux variables

La relation entre deux variables numériques peut être visualisée à l’aide d’un nuage de
points.

Par exemple, voici un graphique du nombre d’heures de sommeil de 83 espèces de


mammifères en fonction de leur masse corporelle. Le jeu de données provient d’une
étude de Savage et West (2004) et est inclus avec le package ggplot2 dans R.

À première vue, il semble y avoir une tendance à dormir moins longtemps chez les plus
grands mammifères.

3.4.2. Covariance et corrélation

Prenons deux variables x et y mesurées sur les mêmes unités d’observation. Rappelons-
nous que la variance correspond à la moyenne du carré des écarts à la moyenne d’une
variable.
∑𝑘𝑖=1 𝑛𝑖 (𝑋𝑖 − 𝑋̅)2 ∑𝑘𝑖=1 𝑛𝑖 (𝑋𝑖 − 𝑋̅)2
𝜎𝑋2 = =
∑𝑘𝑖=1 𝑛𝑖 𝑛
La covariance, quant à elle, est la moyenne du produit des écarts de x et y à leur
moyenne respective.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 63 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

∑𝑘𝑖=1(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅) ∑𝑘𝑖=1(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅)


𝜎𝑋𝑌 = =
∑𝑘𝑖=1 𝑛𝑖 𝑛

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 64 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Lorsque les variables tendent à être simultanément au-dessus (ou sous) leur moyenne,
les écarts sont plus souvent du même signe, donc la covariance est positive. Lorsque les
écarts tendent à être de signe opposé, la covariance est négative.

Il est possible de démontrer que la valeur absolue maximale de la covariance est égale
au produit des écarts-type des deux variables. En divisant la covariance par le produit
des écart-types, on obtient donc une valeur normalisée dans l’intervalle de -1 à 1. Cette
valeur est le coefficient de corrélation de Pearson, R.
𝜎𝑋𝑌
𝑅=
𝜎𝑋 𝜎𝑌

3.5. Tests statistiques

Commet savoir si une tendance observée dans un échantillon est bien valable pour
l’ensemble de la population (et n’est donc pas le seul fruit du hasard) ? C’est pour
répondre à cette question que l’on fait appel aux tests statistiques. Ceux-ci permettent de
s’assurer que les résultats observés dans un échantillon sont généralisables (ou non) à
l’ensemble de la population concernée. Ainsi, sous leur contrôle et avec un risque d’erreur
connu1, on saura si l’on peut étendre à l’ensemble de la population des conclusions
établies sur un échantillon de cette dernière.

Trois types de tests sont généralement utilisés :


- Comparaison de moyennes : Le T de Student ;
- Comparaison de proportions ;
- Dépendance entre deux variables : Le chi2.

Pour plus de détail voir l’annexe 7.1 du cahier de l’apprenant.

1 On fixe généralement le degré (ou niveau) de confiance à 95%, soit 5% de risque de se tromper.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 65 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

IV. Thème 4 : Concepts utilisés dans les enquêtes sur le secteur agricole

Cette section présente les principaux concepts utilisés dans les enquêtes du sous-
secteur Agriculture et contenus dans le Recueil des concepts, définitions et
indicateurs utilisés en statistique agricole au Bénin élaboré par la Direction de la
Statistique Agricole. Le recueil contient également les concepts et définitions relatifs aux
sous-secteurs Elevage, Pèche, Foresterie et sylviculture.

4.1. Divers concepts et définitions.

4.1.1. Identification

Milieu de résidence : On entend par milieu de résidence, l’endroit où vit de façon


permanente (six mois et plus) le ménage. Le milieu de résidence peut être urbain ou rural.
Zone urbaine : La zone urbaine s’appuie sur le caractère urbain du milieu. Selon le
Recensement Général de la Population et de l’Habitation de 2013, le milieu urbain est
défini comme une zone hétérogène qui regroupe tout chef-lieu de commune ayant au
moins 10.000 habitants et au moins une des infrastructures ci-après : bureau de poste et
télécommunication, bureau de recette perception du trésor public, système d’adduction
d’eau (SONEB), électricité (SBEE), centre de santé, collège d’enseignement général
avec 2ème cycle, d’une part et tout arrondissement ayant au moins quatre des
infrastructures énumérées ci-dessus et au moins 10.000 habitants. Le quartier est une
portion des zones urbaines dont les limites sont bien connues.
Zone rurale : La zone rurale est formée par les agglomérations qui se situent en dehors
des zones urbaines et le village est une portion des zones rurales dont les limites sont
également bien connues.
Quartier : C’est une portion territoriale d’une ville, d’un village ou d’un hameau.
Village : Un village est une unité administrative formée d’une localité ou d’un ensemble
de localités relevant d’une autorité élue appelée « Chef de village ». Il peut comprendre
des hameaux et des fermes.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 66 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Hameau : Un hameau est une localité ou un ensemble d’habitations, plus important


qu’une ferme, situé en dehors d’un village ou d’une ville dont il dépend
administrativement.
Ferme : Une ferme est une habitation ou un petit groupe d’habitations, située en dehors
d’un village, d’un hameau ou d’une ville dont elle dépend administrativement. Elle est
généralement installée sur une exploitation agricole.
Ferme agricole : Contrat de fermage ou domaine pour lequel ce contrat est passé, ou
bien encore habitation d’un fermier et même, plus généralement d’un cultivateur qui mène
les travaux agricoles.
Zone de dénombrement : La Zone de dénombrement (ZD) est un découpage censitaire
pouvant comporter 800 à 1000 habitants.
Zone de dénombrement agricole : La Zone de dénombrement agricole (ZDA) est un
découpage censitaire pouvant comporter 90 à 120 ménages agricoles.
Bloc d’habitations : Un bloc d’habitations est un ensemble d’habitations délimité par 4
rues dans une ville. En milieu rural, le bloc d’habitations est délimité par un ou des
sentiers, un cours d’eau et une ou des pistes.
Concession : Bâtiments ou constructions clôturés ou non, généralement à usage
d’habitation et pouvant abriter un ou plusieurs ménages.
Ménage : Le concept de "ménage" est fondé sur les dispositions prises par les personnes
individuellement ou d’une façon collective afin de pourvoir à leurs besoins vitaux. On
distingue deux sortes de ménages : le ménage ordinaire et le ménage collectif.
i) Ménage ordinaire : c’est un ensemble de personnes apparentées ou non
reconnaissant l’autorité d’un même individu appelé "Chef de Ménage" et dont les
ressources et les dépenses sont également communes. Elles habitent le plus souvent
sous un même toit, dans la même cour ou la même concession.
Exemple de ménages ordinaires :
- un homme avec son épouse ou ses épouses avec ou sans enfant ;

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 67 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

- un homme avec son épouse ou ses épouses avec leurs enfants non mariés et
ses parents ;
- un homme avec son épouse ou ses épouses vivant avec leurs enfants mariés et
s’associant afin de pourvoir à certains besoins essentiels (le groupe reconnait l’autorité
d’une seule personne) ;
- un homme ou une femme célibataire avec ou sans enfants et subvenant seul (e)
à ses besoins essentiels, alimentaires et autres ;
- un homme ou une femme veuf (ve) ou divorcé (e) avec ou sans enfant ;
- une personne qui loue une pièce et qui ne prend pas son repas avec le ménage
sera considérée comme constituant un ménage ordinaire indépendant. C’est le cas des
célibataires.
- un groupe de célibataires partageant un même logement constitue un ménage
ordinaire s’ils reconnaissent l’autorité d’une même personne qui est le Chef de Ménage.
Dans le cas contraire, ce sont des ménages séparés.
ii) Ménage collectif : Le ménage collectif est défini comme un groupe de personnes
qui n’ont généralement pas de lien de parenté, mais qui vivent en commun dans un
établissement pour des raisons de discipline, de voyage, de santé, d’études ou de
travail. Les établissements où l’on trouve des ménages collectifs sont : les casernes,
les internats scolaires, les prisons, les monastères, les couvents et les communautés
religieuses, les orphelinats, les asiles d’aliénés, les hôtels, les baraquements de
chantiers temporaires. Si un ménage ordinaire vit dans un des établissements cités ci-
dessus (ménage du responsable d’une prison, d’un directeur d’hôpital), il sera
naturellement recensé comme ménage ordinaire. Ces personnes occupent des
logements de fonction.
Agriculture : Ensemble des activités économiques ayant principalement pour objet la
culture des terres, et d’une manière générale « l’ensemble des travaux transformant le
milieu naturel pour la production de végétaux et d’animaux utiles à l’homme ».

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 68 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Activités agricoles : Sont considérés comme activités agricoles, toutes les activités
couvrant l’agriculture, l’élevage, la pêche, l’aquaculture, la pisciculture, la sylviculture et
l’apiculture.
Activités non agricoles : En dehors des activités agricoles susmentionnées, toutes les
autres activités génératrices de revenus sont considérées comme des activités non
agricoles.
Ménage agricole : C’est un ménage dans lequel un ou plusieurs membres ont une
activité agricole soit à plein temps, soit à temps partiel.
Exploitation agricole : « Une exploitation agricole est une unité économique de
production agricole soumise à une direction unique et comprenant tous les animaux qui
s’y trouvent et toute la terre utilisée entièrement ou en partie pour la production agricole,
indépendamment du titre de possession, du mode juridique ou de la taille. La direction
unique peut être exercée par un particulier, par un ménage, conjointement par deux ou
plusieurs particuliers ou ménages, par un clan ou par une tribu, ou par une personne
morale telle que société, entreprise collective, coopérative ou organisme d’État.
L’exploitation peut contenir un ou plusieurs blocs, situés dans une ou plusieurs régions
distinctes ou dans une ou plusieurs divisions territoriales ou administratives, à condition
qu’ils partagent les mêmes moyens de production tels que la main-d’œuvre, les bâtiments
agricoles, les machines ou animaux de trait utilisés pour l’exploitation».
La superficie totale de l’exploitation est la somme :
• des superficies effectivement cultivées et mises en valeur ainsi que les terres
préparées ;
• des jachères temporaires ou permanentes ;
• des superficies sans cultures permanentes ;
• des prairies et pâturages ;
• des superficies non exploitées ;

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 69 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

• des superficies prises en location.


Ainsi, dans le cadre d’une enquête agricole, les champs de tous les membres du

ménage (mari, femme(s), enfants, etc.) font partie de l’exploitation agricole et


doivent être mesurés. Il est nécessaire dans une enquête sur la superficie d’interroger
tous les membres du ménage susceptibles d’avoir un champ, de leur demander s’ils
possèdent des champs à eux personnellement, dont ils sont particulièrement
responsables. On leur demande également s’ils ont, en plus de celles du Chef
d’exploitation, assumé d’autres dépenses au cours de la campagne agricole précédant
l’année d’enquête.
Chef d’exploitation – Exploitant : Le Chef d’exploitation agricole se confond au Chef
du ménage agricole. Dans l’exposé qui suit, les deux termes : Chef d’exploitation et
Exploitant seront utilisés indifféremment ; ils sont synonymes.
Le chef d’exploitation ou Exploitant est la personne qui assure la mise en valeur de
l’exploitation et prend des décisions courantes pour la gestion de celle-ci. Par exemple,
pour les champs qui assurent en quelque sorte l’existence du ménage, c’est le chef
d’exploitation qui décide de la culture à planter, de la superficie à cultiver, des possibilités
d’utiliser de l’engrais, de l’insecticide, de l’achat d’un attelage, etc. Il arrive que la
personne qui détient le droit sur les terres ne réside pas sur l’exploitation ou exerce
ailleurs une autre activité. Dans ce cas, le chef d’exploitation est celui qui réside sur
l’exploitation, s’occupe de la mise en valeur effective des terres. Il peut être, selon les
cas, un parent du propriétaire, sa femme, son enfant ou un régisseur.

Remarques importantes relatives à la définition de l’exploitation ou de l’exploitant

Une personne isolée peut être chef d’exploitation. C’est le cas du célibataire, du
veuf, ou de la veuve vivant seule. Cependant, il existe bien souvent dans les villages, des
vieillards, des infirmes qui vivent seuls et possèdent autour de la case un jardin qui

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 70 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

pratiquement est insuffisant à leur subsistance. Ils dépendent en fait d’un parent (fils,
frères, sœurs, etc.) ou d’un membre quelconque du village. Dans ce cas, il est préférable
de les rattacher au ménage de l’exploitant dont ils dépendent. Le champ de case du

vieillard fera partie de l’exploitation agricole du ménage en question. Il en est de


même d’une femme mariée qui vit dans une concession autre que celle de son mari.

Les élèves, les étudiants et les apprentis n’étant pas considérés comme des actifs
agricoles, leurs parcelles seront rattachées à l’exploitation du Chef de ménage.
Une femme en cas d’absence prolongée de son mari (6 mois et plus) sera considérée
comme chef d’exploitation.
Un fils célibataire ou non, vit avec ses parents, travaille avec eux sur leurs champs la
plupart du temps, mais possède aussi un ou plusieurs champs, il sera rattaché avec ses
terres à l’exploitation, ses champs seront recensés et mesurés avec ceux de son père
considéré comme seul exploitant.
Cependant, un fils célibataire ou non, vit avec ses parents, mais sur le plan agricole est
complètement indépendant d’eux. Il a ses champs sur lesquels il travaille constamment,
et pour lesquels il prend seul des décisions. Dans ce cas, ce fils sera considéré comme
exploitant et ses champs constituent alors une exploitation indépendante de celle du
père. Vivant sous le même toit que son père, il sera recensé sous le même numéro de
concession que son père avec un numéro distinct d’exploitation agricole (ménage
agricole).
Toutes les personnes qui vivent sur une exploitation agricole doivent être rattachées à
cette exploitation, même si elles n’exercent pas d’activités agricoles.
Deux frères qui vivent ensemble ou pas peuvent constituer : (i) deux exploitations
différentes, si chacun d’eux est totalement indépendant de l’autre en ce qui concerne la
gestion des champs ; (ii) une seule exploitation, s’ils travaillent ensemble et se partagent
les récoltes. Ils sont dans ce cas, deux associés et l’ainé sera considéré comme chef

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 71 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

d’exploitation.
Il arrive parfois que le chef de ménage n’exerce pas d’activités agricoles, et ignore même
l’emplacement des champs. Pour la commodité de l’enquête, il sera considéré comme
chef d’exploitation. Cette situation aussi paradoxale qu’elle puisse paraître, se rencontre
parfois. Le mari, chef de ménage tout en exerçant un autre métier qui constitue son
activité principale, assiste bien sa ou ses femmes ou les autres membres de sa famille
dans la gestion de l’exploitation. L’agriculture sera alors son activité secondaire.

Les quelques remarques énumérées ci-dessus sont loin de représenter l’ensemble des
cas particuliers que l’agent recenseur peut rencontrer sur le terrain. C’est pourquoi il est
indispensable que l’agent recenseur sache poser correctement les questions. Par
exemple, il ne demandera pas à un agriculteur : "es-tu exploitant agricole, ou chef
d’exploitation". Le paysan ignore la signification de ces expressions. C’est à l’agent
recenseur de déduire des réponses aux différentes questions posées :
• si la personne interrogée est le chef de l’exploitation ;
• si à l’intérieur d’une concession, il y a lieu de distinguer plusieurs exploitants ou
chefs d’exploitation.
En conclusion, l’Exploitation Agricole est l’ensemble des terres utilisées entièrement
ou en partie par le ménage pour la production agricole, y compris les animaux qui s’y
trouvent sous la direction générale du Chef de Ménage qui est donc considéré
comme le Chef d’Exploitation.

Sous-exploitation agricole : Une sous-exploitation est une activité ou un groupe


d’activités agricoles gérées par une personne ou un groupe de personnes données du
ménage, pour le compte de ce dernier. Il peut y avoir une ou plusieurs sous-exploitations
dans une exploitation. Une sous-exploitation pourrait être constituée d’une seule parcelle
ou même de toute l’exploitation. Une sous-exploitation pourrait aussi être une activité
d’élevage associé à une parcelle ou une activité d’élevage sans terre.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 72 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Exploitation moderne : Une exploitation de type moderne est une exploitation où les
rapports de travail entre personnes sont basés sur des règles bien définies en la matière
et qui se caractérise par l’existence d’équipements et de matériels agricoles (tracteurs,
attelages, etc.), l’utilisation d’une main-d’œuvre salariée, l’application des paquets
techniques, la tenue de comptabilité et l’exploitation de grande superficie.
Champ : Un champ est une étendue de terre d’un seul tenant mise en valeur par une ou
plusieurs personnes d’une même exploitation dont les limites sont bien déterminées par
des bords naturels ou physiques et toujours bien visibles. Ces limites pourront être : soit

une route, un marigot, une rivière, un enclos ou le champ d’une autre exploitation. Un
champ peut porter une seule ou une association de cultures ou comprendre une ou
plusieurs parcelles portant des cultures ou des associations de cultures.
Parcelle : Une parcelle est une étendue de terre d’un seul tenant portant une seule
culture ou une association de cultures semées en partie à la même date. Dans le cas de
cultures permanentes ou arbustives, une parcelle est composée d’arbres ayant le même
âge. Par exemple, un champ de café ou de palmiers à huile comporte sur une partie des
caféiers ou de palmiers à huile de 5 ans et sur une autre partie des caféiers ou de palmiers
à huile de moins d’un an, suivant les concepts et définitions adoptés, nous sommes en
présence d’un champ avec deux parcelles.
Jachère : Une jachère correspond à un champ qui après avoir été cultivé pendant une
certaine période est laissé au repos pour permettre la régénération du sol. Culture
temporaire : Cultures ayant un cycle de végétation inférieur à un an, qui doivent être
réensemencées ou replantées après la récolte pour la production ultérieure.
Culture permanente : Cultures ayant un cycle de végétation supérieur à un an et qui
peuvent attendre plusieurs années avant d’être replantées.
Culture de rente : Culture dont la principale destination est la vente.
Légumes en culture pluviale : Il s’agit des légumes cultivés sur les parcelles pendant
la saison agricole sans apport d’eau délibéré.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 73 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Agrumes : C’est la culture des orangers, des citronniers, des mandariniers, des
pamplemoussiers, etc.
Mode de faire valoir : Les systèmes de gestion d’exploitation agricole rencontrés sur le
terrain concernent deux modes de faire-valoir : le faire-valoir direct et le faire-valoir
indirect.
(i) La superficie exploitée en mode de faire valoir direct : l’exploitant exploite lui-
même la terre qu’il possède selon un droit de propriété. Les exploitants en faire-valoir
direct sont souvent aidés par une main-d’œuvre familiale ou salariée. Ce mode de
(ii) faire-valoir est du ressort des paysans jouissant de l’appropriation par héritage
et/ou par achat ;
(iii) Les superficies exploitées en mode de faire valoir indirect : regroupent
toutes les terres cédées en métayage ou en fermage, généralement pour une période
limitée.
Gage : C’est une garantie, une assurance de remboursement d’une dette. Le mot gage
est en général réservé aux objets immobiliers.

Actif Agricole : L’Actif Agricole est toute personne âgée de quinze (15) ans et plus et
qui exerce une activité agricole, que ce soit en temps plein ou à temps partiel. Les élèves,
étudiants et apprentis sont exclus même si leur participation n’est pas négligeable et s’ils
peuvent avoir leur propre champ.
Aide Familiale (A.F.) : Toute personne âgée de quinze (15) ans et plus, qui contribue à
la mise en valeur de l’Exploitation du ménage sans aucune contrepartie directe en nature
ou en espèce. C’est le cas des femmes et des enfants du Chef d’Exploitation qui vivent
avec lui.
Salarié Agricole (S.A.) : Toute personne travaillant dans une exploitation agricole contre
une rémunération en espèce ou en nature.
Régisseur agricole : Personne salariée assurant les mêmes fonctions qu’un exploitant
agricole.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 74 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Accroissement de la production agricole (taux d’) : Écart entre la production agricole


d’une année (ou d’une campagne) donnée et celle de l’année (ou de la campagne)
précédente, rapporté à la production agricole de l’année (ou de la campagne) précédente.
Agriculteur : Toute personne qui cultive la terre ou plus largement qui conduit une
exploitation agricole produisant des cultures ou élevant des animaux.
Agriculture écologique : Agriculture ayant pour préoccupation primaire de gérer ses
effets sur l’environnement, de façon à ce que les enjeux environnementaux soient
réellement pris en compte par des pratiques agricoles adaptées.
Agriculture intensive : Agriculture caractérisée par l’usage important d’intrants, et qui
cherche à maximiser la production.
Agriculture raisonnée : Mode de production agricole qui cherche à maîtriser les effets
positifs et négatifs de l’activité agricole sur l’environnement tout en assurant la qualité
des produits, ainsi que le maintien voire l’amélioration de la rentabilité des exploitations.
Elle repose sur l’adoption de pratiques considérées comme respectueuses de
l’environnement par l’expérience scientifique, afin d’assurer un développement durable.
Agriculture traditionnelle : Système de production basé sur la polyculture et l’élevage.
Il ne permet que de subvenir partiellement aux besoins alimentaires de la population.
Agroforesterie : Pratique culturale utilisant les capacités de certaines espèces d’arbres
à contribuer à l’amélioration des productions de cultures temporaires. Il s’agit en général
de fonctions de protection des cultures (brise-vent, haie), d’amélioration des sols
(drainage, défense contre l’érosion) ou d’association permettant d’améliorer la fertilité du
sol.
Association de cultures : Situation dans laquelle deux ou plusieurs espèces de plantes
occupent la même parcelle.
Culture : Espèce de plante cultivée par les agriculteurs : herbes pour les vaches,
céréales pour l’alimentation animale et humaine, etc.
Culture attelée : Utilisation dans les activités agricoles d’au moins une charrue.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 75 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Cultures céréalières : Elles regroupent le blé, le maïs, le sorgho (blanc et rouge), le riz
et le fonio.
Cultures de rente : Elles regroupent le coton, l’arachide, le sésame et le soja.
Culture mécanisée : Utilisation dans les activités agricoles de moyens mécaniques à
moteur dans l’exécution des travaux.
Production agricole : Faire naitre à partir des semences, boutures, pépinières (graines,
des tiges/manioc, maraichage, etc.).
Fermage : Allocation de terre (champ ou parcelle) pour laquelle le propriétaire doit
recevoir un paiement fixe défini au moment de la transaction et ne tenant pas compte du
résultat de la production. Le paiement peut être fourni en nature.

Flux : Mouvement de marchandises qui passent d’un marché à un autre, d’un terroir à
un autre ou d’un pays à un autre, pendant les opérations d’échanges qui portent sur le
transfert d’une quantité plus ou moins importante du produit.
Flux externe : Mouvement d’une quantité d’un produit d’une région ou d’un pays à une
autre région ou un autre pays.
Flux interne : Mouvement d’une quantité d’un produit d’une zone à une autre dans un
même pays ou région.
Flux transfrontalier : Mouvement d’une quantité d’un produit s’effectuant d’un pays à un
autre.
Fosse compostière : Fosse contenant un mélange décomposé de résidus végétaux et
minéraux avec très peu de déjections. Le produit final obtenu est bien décomposé et est
appelé compost.
Fosse fumière : Fosse contenant un mélange décomposé de pailles plus ou moins
piétinées (litières) et de déjections d’animaux et auquel il est conseillé d’ajouter du
phosphate. Le produit final obtenu est appelé fumure organique.
Investissement agricole par unité de superficie : Rapport entre l’investissement
(acquisition du matériel d’attelage, de tracteurs, d’animaux de trait, du matériel de

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 76 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

traitement, du matériel de transport, du matériel d’exhaure, etc.) en valeur réelle et la


superficie totale emblavée.
Irrigation (taux d’) : Rapport entre l’ensemble des terres irriguées et la superficie totale
emblavée.
Légume : Plante cultivée destinée à la consommation humaine, en frais, surgelé ou en
conserve.
Marché de collecte : Marché mettant en prise producteurs et commerçants.
Marché de détail ou de consommation : Marché animé par des grossistes et/ou des
collecteurs, et des consommateurs.
Marché de regroupement : Marché animé essentiellement par des producteurs et/ou
des collecteurs, et des commerçants grossistes.
Marché frontalier : Marché situé à la frontière du pays.

Marché régional : Marché animé par la présence d’acteurs étrangers.


Matériels agricoles : Ensemble des outils et machines utilisés pour l’implantation et
l’entretien des cultures ainsi que pour l’élevage des animaux.
Matrice d’allocation des superficies : Table d’allocation de la superficie entre les
différentes cultures. Chaque élément donne la proportion de superficies occupées par
une culture selon le type d’association et le mode de faire valoir (typologie d’exploitation)
dans la région. C’est donc une table d’assolement des cultures sur un hectare type. La
matrice est conjoncturelle dès que la stratégie d’assolement varie d’une campagne à
l’autre.
Métayage : Forme de location de terre (cham ou parcelle) pour laquelle le bénéficiaire
doit attribuer un pourcentage de la production obtenue de la terre louée au propriétaire.
Ce pourcentage est fixé à l’avance au moment de la transaction.
Mode de faire valoir direct avec titre de propriété : Allocation de terre faisant suite à
un achat et qui fait l’objet d’une transaction enregistrée.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 77 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Mode de faire valoir direct sans titre de propriété : Allocation de terre faisant suite à
une transaction non enregistrée : prêt à titre gratuit, attribution coutumière, etc.
Parcelle : Portion de terrain exploitée par un ou plusieurs membres du ménage et portant
une seule culture ou une association de cultures.
Période de consommation céréalière : Période allant du 1er octobre d’une année au 30
septembre de l’année suivante.
Population agricole : Ensemble des membres des ménages agricoles.
Prix au consommateur : Prix relevant d’une transaction entre un détaillant et/ou un
demi-grossiste, et un consommateur sur un marché de détail.

Prix au producteur : Prix relevant de la transaction entre producteurs et/ou collecteurs,


et commerçants sur un marché de collecte.
Prix au regroupement : Prix de gros ou de demi-gros relevé sur un marché de
regroupement.
Production céréalière disponible : Production nette de mil, de sorgho, de maïs, de fonio
et de riz de la campagne agricole précédente.
Produit phytosanitaire : Produit qui soigne les organismes végétaux.
Redevance : Montant en espèces versé par un exploitant agricole pour l’utilisation
d’infrastructures ou de services communs mis à disposition par une structure
d’aménagement sans distinction de statut : groupement, coopérative, union, société.
Rendement en principale : Rendement moyen à l’hectare des parcelles des cultures
pour lesquelles il existe au moins deux cultures, et la culture considérée est la plus
dominante en nombre de pieds.
Rendement en pure : Rendement moyen à l’hectare des parcelles des cultures pour
lesquelles il n’existe qu’une seule culture.
Rendement en secondaire : Rendement moyen à l’hectare des parcelles des cultures
pour lesquelles il existe au moins deux cultures, et la culture considérée est la deuxième
en termes de nombre de pieds.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 78 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Rendement moyen à l’hectare : Poids moyen obtenu sur un ensemble de parcelles à


partir de la pesée de la récolte sur chaque parcelle d’une portion de 25 mètres carrés
multipliée par 400.
Responsable de parcelle : Personne qui décide des semis sur la parcelle et de
l’utilisation des récoltes.
Revenus agricoles : Revenus tirés de l’exercice de l’activité agricole.
Revenus non agricoles : Bénéfice net tiré de toutes les activités pratiquées par les
membres du ménage en dehors de celui issu des activités agricoles présentes sur
l’exploitation agricole.

Sécurisation foncière (taux de) : Rapport entre la superficie des terres avec un titre de
jouissance et la superficie totale emblavée. Il exprime le degré de pérennisation du mode
d’accès à la terre.
Sécurité alimentaire : Le concept de sécurité alimentaire fait référence à la disponibilité
ainsi qu’à l’accès de nourriture en quantité et en qualité suffisante. La sécurité alimentaire
comporte quatre dimensions : (1) Disponibilité (production inférieure, capacité
d’importation, de stockage et d’aide alimentaire) ; (2) Accès (dépends du pouvoir d’achat
et de l’infrastructure disponible) ; (3) Stabilité (des infrastructures, mais aussi stabilité
climatique et politique) ; (4) Salubrité, qualité (hygiène, principalement accès à l’eau). La
sécurité alimentaire dépasse la notion d’autosuffisance alimentaire. La notion de sécurité
alimentaire est toutefois à distinguer de celle de sécurité sanitaire des aliments, qui a trait
à l’hygiène, la salubrité et l’innocuité des aliments.
Semences sélectionnées : Semences améliorées et certifiées importées ou produites
par des maisons spécialisées ou par des producteurs semenciers et vendues par des
maisons de commerce ou fournies par les structures techniques (centre semencier,
producteurs semenciers) et ONG.
Superficie de la parcelle : Superficie physique de la parcelle occupée par les cultures
sans distinction de densité de culture.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 79 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Superficie en principale : Superficie physique de la ou des parcelle (s) où il y a au moins


deux cultures et la culture considérée est la plus dominante en nombre de pieds.
Superficie en pure : Superficie physique de la ou des parcelle (s) où il n’existe qu’une
seule culture.
Superficie en secondaire : Superficie physique de la ou des parcelle (s) où il existe au
moins deux cultures et la culture considérée est la deuxième en nombre de pieds.
Superficie totale exploitée ou emblavée : Somme des superficies physiques des
parcelles entretenues par les membres des ménages agricoles (superficie en pure plus
superficie en principale).
Horticulture : Science et art de culture des plants des légumes des fleurs des arbustes
et arbres fruitiers ou ornementaux
Horticole : Relatif à la culture des jardins
Maraichage : Culture de légumes réalisée de préférence en zone de marais, ce qui
assure aux végétaux un approvisionnement régulier en eau. Il ne s’agit pas donc de
cultures pluviales. Ces cultures peuvent être faites sous des abris qui assurent leur
protection et permettent leur forçage, sur une superficie plus ou moins importante.
Production forestière ou des arbres : Faire naitre à partir des essences (les pépinières
de teck/plantation teck, etc.).
Sylviculture : Exploitation rationnelle des arbres forestiers (conservation, entretien,
régénération, reboisement, etc.).
Arboriculture : Production et exploitation d’arbres fruitiers.
Irrigation : Apport délibéré d’eau sur les terres pour améliorer la production des
pâturages ou des cultures.
Système d’irrigation : Procédure par laquelle l’eau est amenée d’un point d’eau par des
carneaux et retenue par des diguettes sur une exploitation.

4.2. Erreurs de mesure dans les enquêtes agricoles


Discussions autour d’articles récents sur les erreurs de mesure dans les enquêtes agricoles

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 80 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

• Arthi, V., Beegle, K., De Weerdt, J., & Palacios-Lopez, A. (2016). Not your average job: Measuring
farm labor in Tanzania.
• Dillon, Andrew and Mensah, Edouard Romeo, Respondent Biases in Household Surveys (March
2021). Global Poverty Research Lab Working Paper No. 21-103

Voir Annexes 4.1 et 5.5 : Annexes Cahier de l’apprenant

4.2. Sources et mesure des pertes alimentaires (ODD 12.3.1)

Voir Annexe 6.1 : Annexes Cahier de l’apprenant

Bibliographie

Hervé Gumuchian, Claude Marois, Initiation à la recherche en géographie, Presses de


l’Université de Montréal, https://books.openedition.org/pum/14806

PAR-GES (2015), Support de formation en statistique descriptive du personnel non


statisticien des ministères sectoriels, Ouagadougou, Burkina-Faso, Novembre 2015, 59p.

PSTAT (2018), Manuel de procédures de production des statistiques démographiques,


Brazzaville, Congo, Octobre 2018, 59p.

PSTAT (2018), Manuel de procédures de production des statistiques de l’agriculture, de


l’élevage, et de pêche/aquaculture, Brazzaville, Congo, Octobre 2018, 43p.

Abdennader Chekroun (2018), Statistiques descriptives et exercices, Université Tlemcen,


Algérie, 2017-2018, 89p.

Kevin Polisano (2018), Cours de statistique niveau L1-L2, HAL Archives ouvertes, Mai
2018, 230p.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 81 sur 82
App ui C om p lém e nt air e C e nt r al isé - Pr ogr am m e d ’Ap p ui au
Dével o pp em ent Du r able d u Sec t eur A gr ic ole (PAD DSA)

Christine Dufour, Vincent Larivière (2012), Synthèse principales techniques


d’échantillonnage probabiliste et non probabiliste, SCI6060 – Cour 4, Janvier 2012, 1p.

Bandin Bahouyila (2016), Cours de pratique des enquête, HAL Archives ouvertes, Août
2016, 20p.

Méthodes et techniques de collecte et analyse de données – Formation d’initiation - Septembre 2021

Page 82 sur 82

Vous aimerez peut-être aussi