Vous êtes sur la page 1sur 45

Module 5

Modes de codification, d’archivage et de


traitement des données recueillies pour
l’élaboration des indicateurs

1
Module 5_socio eco 1
INTRODUCTION AU
MODULE 5

Module 5_socio eco 2 2


Objectifs
 Les participants sont
introduits aux notions et
méthodes de dépouillement,
de traitement et d'analyse des
données socio économiques
(codification, saisi des
données, tableau de données,
archivage et traitement des
données, etc.

 Les participants ont pris connaissance d'exemples


pratiques d'appui et d'illustration
3 3
Module 5_socio eco
Agenda
JOURNEE 2
14h30 Introduction du module 5 et rappel des acquis du module 4
(Durée : 15')
14h45 •Présentation PowerPoint par le formateur : Introduction aux
méthodes de dépouillement, de codification de données socio
économiques (codification des données, numérique, alpha
numérique, saisi des données qualitatives et quantitatives,
etc., exemples et méthodes de traitement et d'analyse des
données recueillies pour l’élaboration des résultats, etc.
(Durée : 25')
•Questions/réponses, discussion générale avec modération
sur les aspects présentés dans le PowerPoint, synthèse (Durée
: 40')
•Constitution de groupes (Durée : 10')
16h00 Pause café Module 2_socio eco 4 4
 Travaux de groupes : exercice sur le saisi et
16h30 l'analyse des données, (moyenne, médiane, écart
type, etc.).
(Durée : 45')
 Restitution des résultats, discussions, leçons
tirées, enseignements
(Durée : 15')

Synthèse générale : Discussions et harmonisation


17h30 : Questions/réponses, discussion générale

(Durée : 30')

5
PRÉSENTATION
POWERPOINT
INTRODUCTION AUX
MÉTHODES DE
DÉPOUILLEMENT, DE
CODIFICATION ET
D’ANALYSE DE DONNÉES
SOCIO ÉCONOMIQUES

Module 5_socio eco 6 6


CODIFICATION DES QUESTIONNAIRES

C’est quoi un code ?


Au sens strict un code est un “ dictionnaire
des équivalences entre deux langages “ (Le
Robert)

En quoi consiste une codification ?


L’opération de codification consiste à
reconvertir le langage ordinaire du
questionnaire en un langage qui s’apprête
au traitement informatique.
Module 5_socio eco 7
CODIFICATION DES QUESTIONNAIRES

Comment procéder ?
L’opération de codification correspond à un
chiffrement, elle consiste à accorder un
chiffre unique à une variable, à une modalité
ou une réponse donnée.

Pourquoi un code ?
Rendre possible le traitement et l’analyse
numérique de données récoltées surtout

Module 5_socio eco 8


CODIFICATION DES QUESTIONNAIRES

Types de codes?

Numérique : composé uniquement de


chiffres :
Simple : 1 à n
Décimal : 1, 2, 3, …
11, 12, 13, 21, 22, 23, 31, 32, 33,…
111, 112, 121, 122, 131, 132, etc.

Alphanumérique : combine des chiffres et


des alphabets, comme par exemple : 12a,
12b, 12c ou A1, A2, A3.
Module 5_socio eco 9
CODIFICATION DES QUESTIONNAIRES

Étape de la codification ?
Elle s'effectue en général en deux temps :

 Pré codage du questionnaire :


Codification préalable des questions
fermées et semi fermées

 Codage a posteriori : Codification


complémentaires après la réalisation des
enquêtes sur terrain (Codification des
réponses aux questions ouvertes, etc.)
Module 5_socio eco 10
CODIFICATION DES QUESTIONNAIRES

Exemples pratiques
Questions fermées
1. L’exploitant recrute-t-il de la main d’œuvre
extérieure ?
Code : [1. Oui, 2. Non]

En cas de oui 1

En cas de Non 2

11
Module 5_socio eco
CODIFICATION DES QUESTIONNAIRES

Exemples pratiques
Questions fermées
2. Niveau d’instruction :
Code : 1. Analphabète, 2. Ecole primaire, 3. Niveau secondaire, 4.
Niveau supérieur

En cas Analphabète 1

En cas Ecole primaire 2


Etc….
12
Module 5_socio eco
CODIFICATION DES QUESTIONNAIRES
Exemples pratiques
Questions semi fermées
Quelle est l’activité secondaire du chef de l'UE ?
Code : 1. Agriculture; 2. Élevage; 3. Cueillette; 4. Exploitation du bois; 5.
Commerce; 6. Fonctionnaire; 7. Artisanat; 8. Apiculture; 9.Tourisme; 10. Autre
(préciser) :……………
En cas de Agriculture 1
En cas de Élevage 2
Etc.
En cas de « autre » 10
Puis inscrire la réponse
Module 5_socio eco
13
CODIFICATION DES QUESTIONNAIRES
Exemples pratiques
Questions ouvertes
Quels objectifs en termes de production espérez-
vous atteindre à l’issue de la prochaine campagne
agricole ?
…………………………………………………………………..………………………………………………
………………………………………………………………………………………………………………

Le codage est effectué lors de l'opération de


dépouillement après avoir cerner les réponses et les
grouper, après quoi un code leur sera accordé.

14
Module 5_socio eco
CODIFICATION DES QUESTIONNAIRES
Exemples pratiques
Éclater en deux diapo
Questions ouvertes
Exemple : si, pour un échantillon de 50 individus, les
réponses à la question se présentent comme suit :
 Augmenter la production : 25 individus
 Améliorer la qualité : 10 individus
 Accroître la part de la production biologique : 8
individus
 Diverses réponses différentes pour les 7 restants

Le code sera par exemple le suivant :


1. Augmenter la production, 2. Améliorer la qualité, 3. Accroître la part de
la production biologique, 4. autres
15
DÉPOUILLEMENT ET TRANSCRIPTION
SUR TABLEAU DES DONNÉES
Dépouillement
Ensemble d'opérations de vérification et
d'épuration des questionnaires, de finalisation
de la codification
Cas simples Cas pratiques de
d'échantillon réduit grandes enquêtes

un traitement manuel Le dépouillement


permet de faire informatique est une
ressortir les résultats nécessaire.
16
et leur interprétation.
DÉPOUILLEMENT ET TRANSCRIPTION
SUR TABLEAU DES DONNÉES
Transcription sur tableau des données
Le tableau de données est une matrice
(tableau à double entrée) constitué de n lignes
(individus) et m colonnes (caractères)
Caractères V1 V2 … Vj … Vm M caractères
N Individus ..
Ind. 1
…….
Ind. i
…..
Ind. n 17
DÉPOUILLEMENT ET TRANSCRIPTION
SUR TABLEAU DES DONNÉES
Transcription sur tableau des données
Exemple simple
Caractères Age** Activité Superficie …
Individus (Années) principale* (Ha)** …

1 65 20 0,4 …
2 40 21 1,5 …
3 30 21 0,8 …
4 83 21 2,0 …
……. ……. ……. ……. …
18
* Variables qualitative, ** Variables quantitatives
DÉPOUILLEMENT ET TRANSCRIPTION
SUR TABLEAU DES DONNÉES
Transcription sur tableau des données

Saisie et apurement des données

Après la saisie des données, procéder à la


vérification des erreurs et de la validité des données
introduite dans une opération d'apurement.

L'apurement éviterait d'obtenir des résultats


aberrants dont l'interprétation pourrait induire le
spécialiste en erreur.
19
EXEMPLE DE TABLEAU DE DONNÉES : PROGRAMME ROSELT/OSS (EXTRAIT DU
TABLEAU DE DONNÉES SUR EXCEL DE L'ENQUÊTE NIVEAU 2 (UE)
Cas de l’observatoire de MH, IRA, Tunisie
Caractères
Individus
<

<

20
EXEMPLE DE TABLEAU DE DONNÉES
TABLEAU FORMAT SPSS (Cas de l’observatoire de MH, IRA, Tunisie)

Individus Caractères
<

<

21
TRAITEMENT ET ANALYSE DES DONNÉES

Quand l’opération de T&A des données


pourra être entamée ?
Après avoir été rassuré de la fiabilité du tableau
à la suite de l’apurement.

Dans la pratique des itérations entre


dépouillement et traitement des données
s'avèrent parfois nécessaires (résultats douteux
ou incompatibles)

Donc, des corrections ultimes sont apportées


Module 5_socio eco
dans le tableau de données. 22
TRAITEMENT ET ANALYSE DES DONNÉES

Deux grandes catégories de T&A des


données (selon les besoins de l'approche
méthodologique adoptée) :

 Analyse générale ou tri à plat

 Analyses complexes exigeant


la maîtrise de la modélisation
et/ou de l'économétrie

Module 5_socio eco 23


TRAITEMENT ET ANALYSE DES DONNÉES

Analyse générale ou tri à plat


Deux grandes familles d'analyse :

 Cas des variables qualitatives

 Cas des variables quantitatives

Module 5_socio eco 24


TRAITEMENT ET ANALYSE DES DONNÉES

 Cas des variables qualitatives


Analyse de fréquences
Fréquence : Nombre de fois le cas est présent

Nombre de fois le cas est présent


( ) X 100
Pourcentage : Nombre total de l’ échantillo n

Pourcentage cumulé : Somme des pourcentages


précédents

25
Module 5_socio eco
TRAITEMENT ET ANALYSE DES DONNÉES

Exemple : Résultats des analyses des fréquences de


la variable « niveau d'instruction »
Variables Pourcentage
Fréquence Pourcentage Cumulé
Analphabète 9 36.0 36.0
Koutteb (Ecole
coranique) 3 12.0 48.0

Ecole primaire 11 44.0 92.0


Niveau
secondaire 2 8.0 100.0

Total 25 100.0
Module 5_socio eco 26
TRAITEMENT ET ANALYSE DES DONNÉES
Représentations graphiques

Histogramme de fréquences avec la courbe de la loi normale

Secteurs ou Fromage

Module 5_socio eco 27


TRAITEMENT ET ANALYSE DES DONNÉES

 Cas des variables quantitatives


Je pense
Analyses descriptives
qu’il est
important de
faire une
diapo pour
chaque
param. Avec
formule et
intérêt
28
Module 5_socio eco
TRAITEMENT ET ANALYSE DES DONNÉES

 Cas des variables quantitatives


Analyses descriptives
La moyenne : la moyenne arithmétique, que l’on se contente
généralement d’appeler moyenne tout court, se calcule de la manière
suivante :
X 1  X 2  X 3  ...  X i  .... X n
X
n
où X1 , X2 , X3, …, Xn sont les valeurs successives de la
variable envisagée, et n le nombre total d’observations.

X
X i
X se lit "x barre"
n
29
Module 5_socio eco
Distribution de fréquences
F1 X1  F2 X 2  ....  Fi X i ....  Fn X n 
X X
FX
i i

n n

Exemple : Soient les âges observés dans une classe d’école


primaire. L’âge moyen des enfants sera de
1*8  14*9  11*10  3*11  1*12
X
30
La moyenne = 9,6 ans ou 9ans 8mois.
Il y a en effet 30 observations au total,
correspondant à l’effectif des 30 élèves de la classe.
Module 5_socio eco 30
La variance et écart-type :
la variance est égale à la somme des carrés des écarts à la
moyenne rapportée à l’effectif de la population. L’écart-type
est la racine carrée de la variance.

La variance.
2   f ( x  x ) 2

n ou n-1

L’écart-type :

 f ( x  x ) 2

n ou n-1

Module 5_socio eco 31


La médiane : la médiane est le paramètre qui divise la
distribution en deux parties égales.
Dans une distribution simple, si le nombre d’observations
est impair, il n’y a aucun calcul à effectuer. Soit, pour 7
entreprises d’une région donnée, les effectifs de leurs
personnels respectifs : 15 25 66 74 87 194 432.
La médiane de la distribution est la 4iéme observation, soit
74. De part et d’autre de 74, en effet, il y a 3 observations. Si
le nombre d’observations est pair la médiane correspond à
la moyenne arithmétique des deux observations centrales.

32
TRAITEMENT ET ANALYSE DES DONNÉES
Exemple : Analyse descriptive de 3 variables quantitatives :
a. Tableau de données et commande des analyse sur SPSS
Analyses
demandées Variables analysées

Module 5_socio eco 33


TRAITEMENT ET ANALYSE DES DONNÉES

b. Tableau des résultats des analyses descriptives (ha)

Écart
Min Max Somme Moyenne Médiane
type

Superficie totale
des terres privées 2 80 819 23 20 20
Superficie
arboricole totale 0 52 503 14 13 10
Superficie totale
des cultures 0 74 420 12 17 5
annuelles

Module 5_socio eco 34


Fin de la
présentation

Merci pour
votre attention
35 35
Pause-café

36
Module 5_socio eco
TRAVAUX DE GROUPES
DES PARTICIPANTS:
EXERCICE CODIFICATION,
SAISI ET ANALYSE DES
DONNÉES QUALITATIVES
ET QUANTITATIVES

Travail en 2
groupes

Module 5_socio eco 37 37


Termes de références pour les travaux
de groupes

Durée : 45 minutes

Objectif
 Exercice et apprentissage des participants à la
codification, le saisi et l’analyse des données
qualitatives et quantitatives

38
ORGANISATION
 Les participants sont organisés en 2 groupes de travail.
 Le support est constitué des questionnaires de l'exercice du
module 4 (il faut insister lors de l'exercice du M4 sur les questions V et IX
dans l'extrait du questionnaire, de bien soigner ces parties qui devront
servir l'exercice du M5 en continuation).
 Groupe 1
 Le groupe 1 est chargé de la codification, saisi et analyse des
variables qualitatives.
 Les supports sont constitués par l'ensemble des
questionnaires remplis lors du module 1,
 Il prendra comme exercice la question :
V. IDENTIFICATION DE L’ACTIVITE PRINCIPALE (PAGES 2 ET
3 DANS LE QUESTIONNAIRE)

39
Groupe 2

 Le groupe 2 est chargé de la codification, saisi


et analyse des variables quantitatives.

 Les supports sont constitués par l'ensemble


des questionnaires remplis lors du module 4,

 Il prendra comme exercice la question :


IX. FORMATION DES REVENUS DE L’UE
(PAGES 5 ET 6 DANS LE QUESTIONNAIRE)

40
TÂCHES DE CHAQUE GROUPE
 Rassemblement des questionnaires auprès
des binômes,
 Extrait des pages correspondantes aux
travaux du groupe (groupe 1 pages 2 et 3,
groupe 2 : pages 5 et 6)
 Dépouillement des données
 Vérification des questionnaires, (bien remplis,
données manquantes, retour aux enquêtés,
etc.)

41
Vérification des codes pré établis et codage des
questions ouvertes éventuellement
Constitution du tableau des données et saisi
des informations
Analyses pertinentes par type de variables
Evaluation des résultats obtenus
Restitution de l'exercice, enseignements tirés,
difficultés etc.
Valorisation du document d'appui relatif aux
résultats obtenus par l'équipe de l'ira pour le cas
de l'observatoire de menzel habib relatif aux
questions traitées.
42
Fin de la
présentation

Merci pour
votre attention
43 43
RESTITUTION PAR LES
RAPPORTEURS DES
TRAVAUX DE
GROUPES

Module 5_socio eco 44 44


DISCUSSION
GÉNÉRALE :
DIFFICULTÉS, LEÇONS
TIRÉES

Module 5_socio eco 45 45