Académique Documents
Professionnel Documents
Culture Documents
Semestre 2
1
Sommaire :
Préambule :
Quelques éléments en préambule ;
Une démarche à « démystifier » ;
La démarche qualité : une question de « bon sens » ;
Objectifs de la formation ;
À votre avis, pourquoi mettre en œuvre une démarche qualité pour les bases de données
issues d’enquêtes de terrain ?
Introduction générale :
1. Qu’est-ce qu’une donnée ?
2. Qu’est-ce qu’une enquête de terrain ?
3. Qu’est-ce qu’une base de données dans le cadre d’enquêtes de terrain ?
4. Qu’est-ce qu’un processus de cycle de vie des données ?
1. Chapitre 1 : Réalisation d’une enquête.
2. Définition de l’enquête ;
3. La statistique comme outil d’analyse des enquêtes ;
4. Les méthodes d’échantillonnage ;
5. Choix d’une méthode et taille de l’échantillon ;
6. Les sources d’erreur ;
7. Étapes de réalisation d’une enquête ;
Chapitre 2 : Conception du questionnaire
1. Qu’est-ce qu’un questionnaire ? (logiciel Sphinx local et en ligne : Sphinx DECLIC 2);
2. Etapes de la construction d’un questionnaire ;
3. Règles de base pour l’élaboration du questionnaire ;
4. Type de questions ;
5. Formulation et rédaction d’un questionnaire ;
6. Administration d’un questionnaire ;
7. Agencement du questionnaire ;
8. Les erreurs induites par le questionnaire ;
2
Une démarche à « démystifier » :
Outil organisationnel ;
Pas une contrainte supplémentaire ;
Culture « qualité » passe par une « culture de débat » ;
Cercle vertueux de la qualité :
Processus dynamique qui passe par :
- Une appropriation et une prise de conscience individuelle ;
- Qui se met progressivement en place au niveau collectif (unité, institution …)
D’où la philosophie de la formation :
La roue de Deming est un moyen mnémotechnique qui permet de repérer avec simplicité les étapes à
suivre pour améliorer la qualité dans une organisation.
Il ne faut pas croire que PDCA signifiait please don't change anything (« prière de ne rien changer »).
La méthode comporte quatre étapes, chacune entraînant l'autre, et vise à établir un cercle vertueux.
Sa mise en place doit permettre d'améliorer sans cesse la qualité d'un produit, d'une œuvre, d'un
service, etc.
2. Do : développer, réaliser, mettre en œuvre (le plus souvent, on commence par une phase de
test) ;
4. Act (ou Adjust): agir, ajuster, réagir (si on a testé à l'étape do, on déploie lors de la phase act).
3
Roue de Deming (PDCA) dans notre cas
Apprendre de ses erreurs ;
Les identifier ;
Les corriger ;
Faire en sorte qu’elles ne se reproduisent pas.
Objectifs de la formation :
Etablir et organiser le processus de cycle de vie des données, depuis l’élaboration du
questionnaire jusqu’à la mise à disposition des données ;
Décrire les différentes méthodes d’échantillonnage ;
Définir les notions fondamentales relatives au processus de réalisation d’enquête ;
Structurer une base de données en lien avec la structuration du questionnaire d’enquête ;
Assurer la traçabilité et la fiabilité des données collectées ;
Description du traitement et d’analyse des données ;
Créer une dynamique d’auto-évaluation constructive pour les enquêtes réalisées, basée sur le
principe de la roue de Deming.
À votre avis, pourquoi mettre en œuvre une démarche qualité pour les bases de
données issues d’enquêtes de terrain ?
Réponse par mots clefs :
Point de vue du chercheur ;
Point de vue des revues ;
Point de vue des pairs ;
Point de vue des financeurs ;
La mise en œuvre d’une démarche qualité pour les bases de données issues d’enquêtes de terrain
constitue un enjeu majeur pour la communauté scientifique, les enjeux de données étant la base des
études réalisées.
Dans ce contexte, mettre en œuvre une démarche qualité aux différentes étapes du cycle de vie des
données représente un enjeu essentiel.
La base de données est l’élément clef d’aujourd’hui pour les découvertes et les publications de demain.
4
Les enjeux de la démarche qualité : Compréhension par l’exemple :
Définition en 3 temps :
- Définition générique
- Rechercher plus simplement
- En ce qui nous concerne
Compréhension par l’exemple :
Enquête auprès de producteurs pour connaître :
- Leur structure d’exploitation
- Leur utilisation de produits phytosanitaires
Fiabilité :
Aptitude d’un dispositif, d’un produit, d’un service à maintenir son niveau de qualité dans le temps.
Pour qu’une donnée soit fiable, sa mesure doit être uniforme d’un individu à l’autre dans l’enquête,
quel que soit le lieu ou bien le moment. Tout le monde doit entendre la question de la même façon.
Exemple : « Combien avez-vous dépensé ? » Tout le monde doit répondre avec la même unité – en
dirham, en euro, en dollar, ou en litre ou en Kg ou en nb de bidons …
Traçabilité :
Exemple : Être capable de retrouver les producteurs interrogés et être capable de retrouver les
réponses apportées à la question : « Combien avez-vous dépensé en produits de nettoyage ? »
Reproductibilité :
Qualité d’une mesure qui donne les mêmes résultats si on la répète dans les conditions différentes et à
des époques différentes.
Il est possible de retrouver sur le terrain et de réaliser les mêmes enquêtes avec les mêmes
questionnaires.
Pérennité :
Des dépenses calculées en Dh auront un même sens en 2015 et en 2020. Si on considère le nombre de
bidons, la pérennité n’est pas garantie si la taille des bidons évolue.
5
Transférabilité :
Pouvoir donner à un tiers mes données, qu’elles soient compréhensibles et réutilisables par d’autres.
Je peux faire suivre à un collègue mon questionnaire et mes données. Il les interprétera de la même
façon que moi. Les dépenses en dirham qu’il calculera seront les mêmes que celles que j’aurai
calculées.
La démarche qualité vous permet de mieux organiser votre collecte, votre saisie et vos
traitements de données.
6
Introduction générale :
Le concept d’information est au cœur de la problématique, chaque décision nécessite un préalable qui
est la recherche d’information, cette recherche d’information peut se faire soit à travers l’analyse des
ensembles nombreux soit à travers l’analyse de l’information comportementale (cette information sur
les comportements d’autrui) le premier type d’information relève de la statistique au sens classique
du thème. Le deuxième type relève compte à lui d’une nouvelle approche comportementale qu’est la
théorie des jeux crée en 1944 par J.Von NUEMAN et O.MORGENSTERN et des autres qui
reçoivent ses lettres de noblesse par l’obtention du prix Nobel de l’économie (HARSANY/
SELTEN/ NASH en 1994 et SCHELLING/AUMANN en 2005).
La réalisation d’une enquête est un outil pertinent de recueil de l’information afin de répondre à
l’ensemble des questions posées au niveau d’une problématique.
Le déploiement d’une enquête consiste principalement à poser des questions et à faire compiler les
réponses pour obtenir des statistiques. Pour comprendre le processus complet de réalisation d’une
enquête, il est pertinent d’énumérer toutes les tâches nécessaires et de connaître leurs liens et leur
pertinence.
Jeu de données
Cartes
Photos
7
Vidéos
Audio
Images
Enquête de terrain :
8
3. Qu’est-ce qu’une base de données dans le cadre d’enquêtes de terrain ?
Base de données :
Une base de données est un ensemble structuré et organisé de données qui représente un système
d’informations. Les données doivent pouvoir être consultées par des utilisateurs ou interrogées par
des programmes.
Exemple : On a interrogé des étudiants pour connaître leur relevé de notes afin de constituer la base
de données suivante :
Le PCV décrit le processus d’utilisation des données de leur création à la publication et à leur
réutilisation ultérieure.
Dans le cadre de données issues d’enquêtes de terrain, le processus est défini en 7 étapes :
1- Elaboration / conception du questionnaire
2- Préparation à la collecte ;
3- Collecte des données ;
4- Saisie des données ;
5- Saisie et validation des données ;
6- Gestion des dossiers relatifs aux étapes du processus du cycle de vie des données ;
7- Archivage ;
8- Mise à disposition.
9
10
Chapitre 1 : Réalisation d’une enquête.
1. Définition de l’enquête :
Qu’est-ce qu’une enquête ? Une enquête est une activité organisée et méthodique de collecte de
données sur des caractéristiques d’intérêt d’une partie ou de la totalité des unités d’une
population à l’aide de concepts, de méthodes et de procédures bien définis. Elle est suivie d’un
exercice de compilation permettant de présenter les données recueillies sous une forme
récapitulative utile. Une enquête commence habituellement s’il y a un besoin d’information et s’il
n’y a pas de données ou si elles sont insuffisantes. C’est parfois l’organisme statistique lui-même qui
en a besoin ou un client à l’externe, peut être un ministère, un organisme gouvernemental ou un
organisme privé. L’organisme statistique ou le client veut habituellement étudier les caractéristiques
d’une population, assembler une base de données à des fins analytiques ou vérifier une hypothèse.
Une enquête comprend plusieurs étapes liées entre elles, notamment, la définition des objectifs, la
sélection d’une base de sondage, le choix du plan d’échantillonnage, la conception du questionnaire, la
collecte et le traitement des données, l’analyse et la diffusion des données, et la documentation de
l’enquête.
La durée d’une enquête peut être répartie en plusieurs phases. La première est la planification,
viennent ensuite les phases de la conception et de l’élaboration puis, celle de la mise en œuvre. En
bout de ligne, tout le processus de l’enquête est examiné et évalué.
La réalisation d’une enquête est un exemple de production technologique tertiaire. Le produit final :
le rapport d’enquête, quel que soit le support, c’est un ensemble d’informations qui ont été collectées,
analysées, représentées. Comme toute production technologique, la réalisation d’une enquête doit
obéir à une démarche cohérente et logique.
La démarche de résolution de problème QQOQCP est assez appropriée pour une enquête.
11
Il est clair que la première question à se poser est pour Qui ?
La seconde question à se poser est Pourquoi ? Pour quelles raisons le commanditaire veut-il
réaliser une enquête ? Que veut-il savoir ? Quelles informations veut-il recueillir ? De quel
type ?
Est-ce une enquête exhaustive ? Une population entière est alors interrogée.
Est-ce une enquête par sondage ? Seul un échantillon de la population est concerné.
12
Où et Quand ?
Le choix des lieux risque d'influencer les résultats. Il faut donc réfléchir aux conséquences de ce
choix.
Les personnes interrogées peuvent répondre chez elles, dans la rue, dans un lieu donné (bureau,
magasin), par téléphone, par correspondance, avec l'aide ou non d'un enquêteur.
Le moment pendant lequel se déroule l'enquête est aussi important (météo, vacances, week-end,
événement particulier …).
C’est l’analyse des ensembles nombreux, l’objectif de ce récapitulatif sera de montrer comment un
individu peut tirer de l’information dans un espace bien déterminé pour ressortir d’une décision. Pour
se faire, on peut approcher cela de manière différente.
Cette approche peut être abordée d’une autre manière à travers la séquence suivante :
Quatre phases sont fondamentales dans ce processus qui peut être présenté comme suit :
- 1er temps : Le questionnaire : Ce qui est fondamental dans une enquête est l’instrument
d’observation qui est l’élément essentiel pour le recueil des données ;
Comme on ne peut pas interroger des fois toute la population, on a recours à l’échantillonnage que
l’on définit comme une méthode utilisée pour choisir une fraction représentative de la population.
- Pour multiples raisons : coût, faible taux de réponse, manque de personnel, impossibilité…
- Échantillon : alternative ;
13
- Échantillon : petit groupe représentatif extrait d’un grand groupe que l’on nomme «
population » ;
- Son but suprême est l’atteinte d’une représentativité impartiale de la population à l’étude
pour que toute estimation basée sur l’échantillon soit sans biais et inférée à la population.
Principe du sondage statistique : « Déduire les propriétés de toute une population à partir de
l’analyse d’un échantillon représentatif».
La représentativité de l’échantillon est fondamentale sinon les résultats seront faux même s’ils
portent sur un très grand nombre d’individus.
On dit qu'un échantillon est représentatif du point de vue statistique quand les unités qui le
constituent ont été choisies de telle manière que tous les membres de la population mère ont la même
probabilité de faire partie de l'échantillon.
Les différentes caractéristiques et catégories de la population mère doivent se retrouver dans les
mêmes proportions dans l’échantillon représentatif.
On dit qu’un échantillon est biaisé lorsque les individus n’ont pas tous la même probabilité de faire
partie de l’échantillon.
Deux principes :
En probabilité, la loi des grands nombres fait qu'à partir d'un certain nombre d'individus tirés au
hasard dans la population mère, on obtient une représentation fidèle de la population ou
suffisamment approchée de celle-ci pour que les écarts soient négligeables.
Ex (Pile ou face) : plus on lance une pièce, plus les proportions de piles et de faces s’approchent de
0,50.
Les individus de mêmes caractéristiques sont équivalents du point de vue statistique à partir d’un
nombre suffisant d’individus.
14
Effectuer un sondage c’est étudier les caractéristiques d’une population à partir d’un échantillon qui
ont issue qui doit être représentative de cette population. On appelle cette population mère ou
population de référence, il convient alors de trouver une procédure de sélection d’un échantillon c’est
ce que nous appellerons les méthodes d’échantillonnage. On appelle le taux de sondage la quantité t
= n/N ou n est la taille de l’échantillon et N est la taille de la population.
Le problème de l’échantillonnage sera donc celui de la méthode à utiliser pour obtenir une estimation
contrôlée qui permettra de tirer des conclusions sur une situation dans la population.
C’est une phase cruciale en effet, il est indispensable avant de commencer à se poser des questions sur
l’échantillonnage de définir avec précision la population visée.
Il est généralement formé par la liste de toutes les unités à partir de laquelle on tirera un échantillon,
c’est généralement ce que l’on appelle la base de sondage.
La base de sondage est l’ensemble des moyens pour identifier les unités de la population d’enquête et
de communiquer avec elles.
15
Les personnes qui pratiquent une activité touristique : par exemple : les projets déjà créés
selon toutes les formes juridiques à savoir : les entreprises physiques, les sociétés, les
associations, les coopératives, etc. ;
Les promoteurs qui postulent de créer une activité touristique : les bailleurs de fonds qui
occupent des postes de travail dans des activités touristiques et qui veulent créer leurs
propres entreprises.
Remarque : ce cadre d’échantillonnage n’est pas toujours nécessaire, notamment lorsqu’on travaille
avec des méthodes non probabilistes.
Il s’agit de définir les éléments qui constituent la population, donc l’unité de base que l’on cherche à
questionner, il ressort de ces trois points que la population est constituée d’éléments appelés individu
statistique. Chaque individu va avoir des propriétés appelées caractère et chaque caractère aura des
modalités.
Variables
Variables Variables
quantitatives qualitatives
Continue Nominale
Discrete Ordinale
Température Poids Sexe
Nbre enfant Degré
langues parlées
Il existe deux grandes méthodes : au sein de chaque une de ces grandes familles, il existe plusieurs
techniques :
16
Les échantillons de convenance ;
L’échantillon systématique ;
L’échantillon aréolaire ;
Pour des raisons de commodité l’enquêteur peut être conduit à utiliser des méthodes empiriques, se
sont des méthodes qui cherchent à réaliser un modèle réduit de la population observée en
sélectionnant les mêmes proportions d’unité différente. Ces techniques sont peu couteuses, rapides et
faciles à mettre en œuvre.
Chaque unité incluse à l’intérieur d’une population n’a pas une chance égale d’être sélectionnée =>
On ne peut pas estimer la marge d’erreur due à l’élaboration de l’échantillon et généraliser les
conclusions à l’ensemble de la population.
On part d’un échantillon comportant un nombre restreint de personnes auquel on ajoute d’autres
personnes avec lesquelles les premières se déclarent en relation et ainsi de suite jusqu’à ce que
l’échantillon soit complet c’est une méthode économique comporte cependant un risque de biais dans
l’observation.
Exemple : On interroge des premières personnes et ils nous indiquent les autres personnes
concernées par l’enquête = > Réseau d’interconnaissance.
17
La méthode des quotas ;
Le principe repose sur la reproduction, la plus fidèle possible de la population mère, une fois les
quotas définis, l’enquêteur est libre de choisir son échantillon, à condition de respecter les quotas
définis. Les caractères retenus pour assurer la conformité de l’échantillon à l’ensemble de la
population seront appelés variable de contrôle. Pour appliquer la méthode des quotas, il faut
connaître la distribution de la population selon ces variables de contrôle c’est une condition
nécessaire à l’utilisation de cette méthode.
En multipliant les quotas par le taux de sondage en s’assure que l’échantillon aura bien la même
structure que la population en égard aux variables de contrôle. La mise en œuvre de cette
méthode dépendra de deux facteurs fondamentaux :
- Le choix de variable de contrôle : il faut une variable qui satisfasse à des conditions
d’efficacité et de mise en application de la méthode 3 conditions au moins doivent
être satisfaites :
- Le contrôle des enquêteurs : dans une enquête par sondage aléatoire les enquêteurs
vont travailler sur les listes d’adresses ou de personnes, il sera plus ou moins facile de
vérifier si les enquêteurs se sont conformes ou pas a ces listes lorsque l’enquête par
quotas ou choisir les personnes à enquêter. Pour limiter ce risque, on peut imposer à
chaque enquêteur un itinéraire strictement fixé en lui indiquant exactement les
individus à enquêter. Le travail de l’enquêteur peut par conséquent être contrôlé.
Si un échantillon est représentatif sur quelques grandes variables sociodémographiques, alors il sera
représentatif sur les variables que l’on veut étudier.
les mêmes proportions en ce qui concerne des caractéristiques (les variables de contrôle) :
les variables sociodémographiques.
Les avantages :
18
– Le coût est plus faible : personne précise non obligatoire
Les inconvénients :
Les inconvénients reposent sur les fondements théoriques insuffisants de cette méthode qui ne
permet pas de calculer l’erreur susceptible d’avoir été commise dans l’extrapolation des résultats
obtenus sur un échantillon vers la population d’origine.
– La non-représentativité
Exemple d’application 1 :
Soit une population étudiée selon deux variables l’âge et le nombre d’enfants par individus.
<20 110 0 50
35-40 190 4 75
L’organisme de sondage qui travaille sur cette population décide d’un taux de sondage de 20 %, il
dispose en outre 10 enquêteurs
Travail à faire :
19
Réponses :
Nombre
L’âge ni fi % 20% Enq ni fi % 20% Enq
D’enfant
Si un taux de sondage de 1/20 est préalablement choisi, cela signifie que le rapport « taille de
l’échantillon / taille de la population étudiée » doit être égal à 1/20.
C’est une méthode pratique utilisée pour ses aspects économiques. On fixe à l’enquêteur un point de
départ à partir duquel il doit suivre un itinéraire (trajet) déterminé. Le gros avantage réside dans le
faite qu’on a besoin de très peu d’information sur la structure initiale de la population.
20
- La non-représentativité ;
La méthode de convenance :
Dans le domaine de la recherche universitaire, un échantillon de convenance est par exemple souvent
composé d’étudiants.
• Les avantages
– La facilité d’application ;
• Les inconvénients :
– La non-représentativité ;
Le choix d’un échantillon de convenance peut parfois nuire à la possibilité de généralisation des
résultats obtenus, car l’échantillon de convenance n’est pas toujours un échantillon représentatif.
L’utilisation d’un échantillon de convenance peut donc occasionner un biais d’échantillonnage.
La méthode de volontaires :
Cette méthode se caractérise par le fait que les individus se sélectionnent eux-mêmes.
Par exemple, on fait appel à participation par : annonces dans les journaux locaux ou nationaux et/ou
d’un dépliant distribué ;
21
3.2.2 Les méthodes probabilistes :
Par méthode probabiliste, on entend toute méthode qui implique le hasard, autrement dit qui donne à
chaque élément de la population une chance connue et non nulle d’être choisi, les méthodes
probabilistes auront pour point de départ une liste de sondage et de base de sondage, elle est
constitué par tous les éléments qui composent la population mère sans erreur ou omission ni
répétition pour chacun des éléments de la population prise avoir la même probabilité d’être tiré au
sort.
- Échantillonnage aléatoire : tous les individus de la population source ont une probabilité
connue et non nulle d’être sélectionnés pour faire partie de l’échantillon ;
- Pas d’intervention du chercheur : seul le hasard régit l’inclusion ou non d’un individu dans
l’échantillon ;
- les informations recueillies sur l’échantillon peuvent être inférées pour la population source.
Échantillonnage à un degré :
- Il peut être simple, stratifié ou en grappe selon le type de base de sondage disponible
Population finie :
- Tirage au sort
- Choix avec nombres aléatoires à partir d’une liste des éléments [Excel : =ALEA () génère
des nombres aléatoires entre 0 et 1]
- Trouver astuce (exemple contrôle douanier : examiner chaque voiture arrivant après une
voiture orange)
Loi de Bernoulli :
22
En mathématiques, la distribution de Bernoulli ou loi de Bernoulli, du nom du mathématicien
suisse Jacques Bernoulli, est une distribution discrète de probabilité, qui prend la valeur 1 avec la
probabilité p et 0 avec la probabilité q = 1 – p.
En d’autres termes :
𝐩 𝐒𝐢 𝐱 = 𝟏
𝐩 𝐗=𝐱 = 𝟏−𝐩 𝐒𝐢 𝐱 = 𝟎
𝟎 𝐒𝐢 𝐧𝐨𝐧
Ou de manière équivalente :
𝐩 𝐗 = 𝐱 = 𝐩𝐱 𝟏 − 𝐩 𝟏−𝐱
, 𝐱 ∈ 𝟎, 𝟏
C’est la procédure la plus simple pour générer un échantillon, elle consiste à utiliser une table de
nombre aléatoire, on opère de façon séquentielle ;
2- On effectue un choix séquentiel dans une table de nombre aléatoire à partir d’un point
quelconque, on constitue ainsi l’échantillon à questionner.
Cette méthode alloue, une chance, à tous les individus d’une population d’être sélectionnés.
L’adoption de cette méthode est appropriée lorsque la population est nombreuse et relativement
homogène
Procédure à suivre :
23
1. Définir clairement la nature de la population ;
3. Sélectionner l’échantillon en choisissant n’importe quelle méthode qui donne une chance
égale, à tous les numéros d’être tirés.
L’échantillon systématique ;
C’est une méthode simple avec des conditions de mise en œuvre très souples. Dans cette méthode,
chaque élément de la population est classé dans un ordre sans importance avec les caractéristiques
retenues. On calcule le taux de sondage et on sélectionne tous les individus séparés par la raison de
l’échantillon.
Les individus retenus sont : 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190.
L’échantillon stratifié :
C’est une méthode sophistiquée qui consiste à diviser la population en sous-population appelée
strates. Chaque strate sera considérée comme population mère dont laquelle on tire aléatoirement un
échantillon. L’ensemble des échantillons choisis constituera l’échantillon final qui sera soumis à
l’analyse.
L’échantillon stratifié :
- Cette méthode permet de représenter les sous- groupes d’une population hétérogène. Cette
façon un peu plus complexe d’échantillonner, elle garantit que chaque sous-groupe de la
24
population est représenté d’une certaine manière dans l’échantillon ;
Procédure à suivre pour l’échantillonnage stratifié proportionnel à la taille des sous-groupes dans la
population :
5 Sélectionner l’échantillon en choisissant n’importe quelle méthode qui donne une chance
égale, à tous les numéros d’être tirés à l’intérieur d’un sous-groupe. Du coup, il faut s’assurer
que chaque sous-groupe est représenté proportionnellement à sa représentation dans la
population
25
L’échantillon en grappes ;
On entend par grappe le fait de choisir aléatoirement des sous-groupes dans la population est
d’interroger toutes les unités de chaque sous-groupe.
L’échantillon en grappes :
- La population source est subdivisée naturellement en groupes (la composition des grappes
est antérieure au plan de sondage) ;
Intérêt : lorsque l’accès à la liste des individus composant la population d’étude n’est pas possible ;
26
Avantage :
- Échantillonnage aléatoire malgré l’absence de liste exhaustive ;
- Réduction des coûts par concentration.
Limites :
- Les grappes : risque de ne pas représenter correctement la variabilité ;
- Les grappes utilisées doivent être de tailles à peu près équivalentes
L’échantillon aréolaire ;
Avec cette technique on pourrait éventuellement se passer d’une base de sondage c’est plutôt une
carte géographique qui fera office d’une liste. Les éléments de cette liste seront des zones qui seront
par la liste tirées au sort.
Même principe que l’échantillonnage par grappes en tirant cette fois-ci des aires géographiques.
Un ménage, au sens statistique, est défini comme l'ensemble des occupants d'une résidence principale,
qu'ils aient ou non des liens de parenté. Un ménage peut ne comprendre qu'une seule personne.
On désigne des unités d’échantillon qui peuvent être primaires secondaire tertiaire, etc.
Intérêt : lorsque l’accès à la liste des individus composant la population d’étude n’est pas possible.
27
4. Choix d’une méthode et taille de l’échantillon :
Il existe plusieurs techniques cependant le choix doit se faire en fonction des objectifs de l’enquête et
du degré de précision souhaité de la même façon, la taille optimale de l’échantillon. C’est une question
importante qui trouve sa réponse dans la théorie statistique.
Les critères de choix et comment choisir une méthode va dépendre de divers facteurs :
Toujours, les méthodes aléatoires nécessitent une base de sondage ce qui n’est pas nécessaire pour les
méthodes empiriques.
Si la population est dispersée géographiquement et si l’enquête doit se faire par interview direct alors
on a intérêt à utiliser des techniques à plusieurs degrés en fonction de la stratification des communes.
La stratification de la population peut être nécessaire lorsque la population n’est pas suffisamment
homogène, on prend en considération le degré d’homogénéité de la population.
B- La taille de l’échantillon :
Pour calculer la taille de l’échantillon pour une enquête, il faut estimer d’abord la proportion1 dans
votre population. Les proportions sont généralement calculées sous forme de pourcentage.
Le calcul de la proportion exacte de la variable à étudier, qui forme la population, est souvent délicat
grâce au manque des statistiques nécessaires à ce sujet. La population peut contenir des milliers
d’individus. Il faut alors calculer la proportion dans un échantillon de la population. La proportion
dans un échantillon valable servira alors d’estimer la proportion dans l’ensemble de la population.
La taille de l’échantillon d’une étude est un facteur déterminant pour obtenir des données fiables à
propos d’une proportion dans une population. La fiabilité des données n’est jamais absolue, mais se
situe plutôt dans un intervalle de confiance. Plus cet intervalle doit être petit, ou plus la marge
d’erreur doit être petite, plus la taille de l’échantillon devra être grande pour obtenir une valeur juste
de cette proportion dans l’ensemble de la population.
La taille de l’échantillon doit être celle qui permet d’atteindre le meilleur équilibre entre le risque de
commettre des erreurs d’échantillonnage, le coût induit par ces erreurs, et le coût de
1
Une proportion est le nombre de personnes dans une population ayant une caractéristique parmi un ensemble
de caractéristiques possibles.
28
l’échantillonnage lui-même. Afin de déterminer la taille de l’échantillon, nous avons utilisé la loi
normale. Alors nous supposons que notre variable suit une loi normale, sinon elle est peut-être
approchée par la loi normale.
Pratiquement, pour calculer la marge d’erreur avec précision pour une distribution statistique. On
utilise la formule suivante de l’intervalle de confiance qui détermine la réponse réelle avec un
pourcentage de 95% :
𝑝(1 − 𝑝)
𝐸=𝑡
𝑛
E : la marge d’erreur ;
t : t = 1,96 c’est la valeur de t statistique selon la loi normale centrée réduite (pour un niveau
𝛼
de confiance de 95 %, t = 1,96 c’est la valeur correspondante à une probabilité égale (1 − 2 )
n : la taille de l’échantillon.
Si on a déterminé la marge d’erreur (par exemple 5%) on peut déduire la valeur de l’échantillon n.
p(1 − p)
E=t
n
p 1−p
E² = (t )²
n
p 1−p
E² = t²
n
n E² = t²p 1 − p
t²
n = p 1−p
E²
t². p(1 − p)
n=
E²
Alors si on remplace t = 1,96 et p = 0,5 alors la formule devient :
0,9604
n =
E²
Alors
29
Si E = 5% la taille de l’échantillon devient n = 384,16 ;
C’est pour cela, la loi statistique recommande toujours à ne pas travailler sur un échantillon de moins
de 30 individus, pour ne pas augmenter la marge d’erreur plus de 18%.
t2. p 1 − p . N
n=
E². N + t². P(1 − p)
N: La population ;
n : La taille de l’échantillon ;
t : niveau de confiance selon la loi normale centrée réduite (pour un niveau de confiance de 95 %, t =
𝛼
1,96 c’est la valeur correspondante à une probabilité égale (1 − 2 ) sachant que 1 − 𝛼 = 95%
E = marge d’erreur tolérée (par exemple, on veut connaître la proportion réelle à 5 % près).
La taille de l’échantillon est une question fondamentale qui comporte un aspect positif et un aspect
négatif.
La moyenne x d’un échantillon peut être considéré comme ayant une distribution normale avec
σ
E x = m et σ(x) = n
lorsque le tirage est avec remise.
30
Supposons que l’on cherche une précision de l’estimation qui soit au moins égale à k% de m alors il
faut :
σ
𝑇 = km
n
T²σ²
𝑛=
k² m²
Remarques :
Lorsque la population sera homogène n sera petit, on aura besoin de moins d’individus pour
constituer un échantillon et pour atteindre le degré de précision donnée 𝛼.
1ère étape : on effectue une enquête sur un échantillon restreint pour évaluer σ et m
2ème étape : on fixe la taille définitive de l’échantillon à partir laquelle on déterminera les
véritables estimateurs de m 𝑒𝑡 σ .
T²σ²
Cette formule 𝑛 = n’est valable que dans un cas particulier : lorsque le tirage est avec
k² m²
remise et lorsqu’on veut estimer la moyenne de la population.
Il existe une méthode empirique très souvent utilisée pour déterminer la taille optimale de
l’échantillon. Elle prend en compte uniquement la contrainte financière, la contrainte du
budget disponible pour l’étude et les coûts fixes qui conduisent à la détermination de la taille
optimale de l’échantillon.
B − CF
n=
Q
B : budget disponible ;
CF : coûts fixes
31
5. Les sources d’erreur :
Malgré les précautions prises, un certain taux d’erreur subsiste ce qui va affecter les résultats.
L’erreur totale relative à une enquête s’analyse en fonction de plusieurs sources.
L’erreur d’échantillonnage :
Le simple faite d’utiliser un échantillon au lieu du recensement, on favorise une erreur qui découle de
la non-observation de la population totale qui dépend du degré d’homogénéité de la population par
rapport à un caractère donné, c’est l’erreur d’échantillonnage ou erreur aléatoire.
L’erreur de mesure :
S’introduisant de la mise en œuvre de l’enquête pour relever : le problème des questions ambigües,
erreur professionnelle de l’enquêteur, etc.
L’enquête est considérée comme outil de recueil de l’information qui permet de répondre à l’ensemble
des questions posées au niveau d’une problématique.
Pour comprendre le processus complet d’une enquête, il est pertinent d’énumérer toutes les tâches
nécessaires et de connaître leurs liens et leur pertinence :
- Formulation de l’énoncé des objectifs ;
- Sélection d’une base de sondage ;
- Choix d’un plan d’échantillonnage ;
- Conception du questionnaire ;
- Collecte des données ;
- Saisie des données ;
- Vérification et imputation ;
- Analyse des données ;
- Diffusion des données ;
Pour planifier une enquête, on va s’intéresser premièrement à préciser la formulation des objectifs le
mieux et le plus clairement possible. Plus les objectifs déterminés sont clairs on pilote toutes les
étapes ultérieures de l’enquête pour garantir que des résultats pertinents de l’enquête.
32
Alors on cite l’ensemble des questions qu’on doit exploiter pour répondre aux objectifs de l’enquête :
Objectif 1 :…………..
Objectif 2 :…………..
Objectif 3 :…………..
Objectif 4 :…………..
Objectif 5 :…………..
Objectif 6 :…………..
Objectif 7 :…………..
…………………..
La base de sondage est l’ensemble des moyens pour identifier les unités de la population d’enquête et
de communiquer avec elles.
Dans notre cas, les variables de cette base de sondage sont comme suit :
La population cible :
La population cible est la population totale pour laquelle on a besoin de l’information. Par exemple, si
vous devez mener une enquête sur les types de voitures les plus populaires à Marrakech, la
population cible serait alors composée de toutes les voitures de cette ville. Il faut décrire les unités
qui composent la population sous forme de caractéristiques les identifiant clairement. Plus
précisément, les caractéristiques suivantes définissent la population cible :
La nature des données dont on a besoin : sur des personnes, des hôpitaux, des écoles, des
entreprises, etc.
La population de l’enquête : La définition de la population est une phase cruciale, en effet il est
indispensable avant de commencer à se poser des questions sur l’échantillonnage pour définir avec
précision la population visée.
33
Marrakech
Etc.
Après avoir terminé toutes les étapes de la procédure séquentielle de l’échantillonnage, nous avons
déterminé la méthode d’échantillonnage à utiliser selon les besoins de l’enquête.
Par la suite, on doit calculer la taille de l’échantillon selon les méthodes utilisées auparavant pour le
plan d’échantillonnage soit complété.
Dans le cadre de l’élaboration d’une recherche scientifique, il faut identifier des pistes d’intervention
concrètes dans un projet de territoire.
Le questionnaire est un document rédigé contenant des questions et des informations, un
moyen de communication, un outil à exploiter,
distinguer les catégories d’information recherchées : faits, connaissances, opinions, attitudes
ou comportements, convictions, motivations. . .
Pertinence et utilité des questions
Motiver et faciliter la tâche de l’enquête avant de simplifier celle du chargé d’études
Souci d’objectivité (neutralité)
Tenir compte du mode de consultation utilisé (par enquêteur, enquête postale, par téléphone.
..)
Penser aux étapes ultérieures : dépouillement, codification, saisie, vérifications, traitements. ..
Il est bon d’anticiper les possibilités de non-réponses. En particulier, il faut prévoir, explicitement ou
non, la possibilité de dire » je ne sais pas », » je suis sans opinion » ou » je refuse de répondre ».
Attention cependant `a la tentation de se réfugier dans ces rubriques.
Le choix des mots utilisés dans une question et sa formulation est important.
34
L’objectif d’une question est d’obtenir une réponse traduisant exactement ou le plus fidèlement
possible une réalité.
Pour commencer l’étude empirique, on aura besoin des supports statistiques et des données
quantitatives et qualitatives sur la base de l’enquête.
La saisie des données est une opération de traitement qui transforme les réponses du questionnaire
obtenues pendant la collecte, pour qu’elles conviennent à la totalisation et à l’analyse des données. Il
comprend toutes les activités de traitement des données, automatisé et manuel, après la collecte et
avant l’estimation.
Après l’étape de la collecte des données au niveau de l’enquête réalisé, il faut procéder à saisir un
tableau qui comprend les différentes variables nécessaires à l’étude de la problématique.
Ce tableau est considéré comme un output du logiciel Sphinx, responsable de la gestion de l’enquête
dés la construction du questionnaire, et en même temps est une matière première pour répondre à
l’ensemble des questions figurées dans la problématique à travers d’autres logiciels à savoir :
Théoriquement et dans un modèle idéal, chaque questionnaire doit être rempli sans erreur. Mais, les
réponses à certaines questions peuvent malheureusement être absentes, incomplètes ou inexactes. La
35
vérification est l’examen des réponses pour identifier les entrées manquantes, non valables ou
incohérentes qui indiquent des enregistrements de données éventuellement erronées. La vérification
permet habituellement d’identifier les erreurs non dues à l’échantillonnage que suscitent les erreurs
de mesure (réponses), les non-réponses ou le traitement.
La vérification vise à :
Après la vérification de la base de données, on doit utiliser l’imputation comme un processus pour
déterminer les valeurs de remplacement, afin de résoudre les problèmes que suscitent les données
manquantes, invalides ou incohérentes. Il faut, au cours de cette étape, changer certaines des
réponses et toutes les valeurs manquantes de l’enregistrement vérifié pour créer un enregistrement
plausible et cohérent.
Certains problèmes sont corrigés lorsque l’enquêteur communique avec le répondant ou lors de
l’étude du questionnaire à la main, mais il est habituellement impossible de résoudre tous les
problèmes de cette façon et l’imputation est appliquée pour régler les autres rejets à la vérification.
36
La classification automatique :
L’Arbre de décision :
L’Analyse discriminante :
Analyse textuelle : logiciel Iramuteq
Statistiques textuelles ;
Nuage de mots ;
Classification Descendante Hiérarchique (CDH) (méthode de Reinert);
Analyse Factorielle de Correspondances (AFC) ;
Analyse Des Similitudes (ADS).
C’est une phase cruciale qui nécessite une certaine expérience, il convient d’interpréter tous les
résultats en partant des dépouillements classiques (Tris à plat et tris à croisé) et en passant par les
méthodes d’analyse multivariée (méthode explicative ou descriptive) pour donner à l’utilisateur les
moyens pour décider.
La communication des résultats passe par un rapport d’enquête qui est l’image de l’étude, ce rapport
doit respecter les normes de rédactions en vigueur.
37
Chapitre 2 : Conception du questionnaire
C’est un moyen essentiel de communication entre l’enquêteur et l’enquêté, c’est l’outil par lequel on
obtient des informations adéquates, c’est un message codé par un émetteur (l’enquêteur) qui doit être
compris et décodé par les enquêtés (les répondants).
Cette liaison entre l’émetteur le récepteur n’est pas neutre pour l’obtention de l’information, elle doit
satisfaire à certaines règles.
- Les caractéristiques du style de la vie du répondant : questions qui porte sur la façon dont
vivre les gents c’est par exemple le revenu ou le lieu d’habitation ;
- Les caractéristiques concernant les attitudes des répondants : on pose des questions qui
convergent vers la prise de position sur des phénomènes de société donnée.
Enfin, on peut dire qu’un questionnaire est un document rédigé contenant des questions et des
informations, un moyen de communication et un outil à exploiter.
38
Motiver et faciliter la tache de l’enquêté avant de simplifier celle de la charge d’études
Souci d’objectivité (neutralité)
Tenir compte du mode de consultation utilise (par enquêteur, enquête postale, par téléphone,
etc.)
Penser aux étapes ultérieures : dépouillement, codification, saisie, vérifications, traitements,
Etc.
4. Type de questions ;
Pour obtenir une information, on peut recourir à différents types de question, le choix d’un type de
question doit nécessairement avoir une relation avec l’information recherchée.
- Les questions ouvertes : l’enquêté doit répondre librement sans que le choix ne soit pas
déterminé.
- Les questions fermées : c’est un choix entre plusieurs réponses possibles de façon limitative.
Pour éviter les inconvénients des questions fermées ou ouvertes, on utilise des questions
préformées qui se caractérisent par des réponses qui sont préparées et on laisse la possibilité
d’ajouter des réponses libres. La question ouverte est nécessaire lorsqu’on veut aborder des
problèmes complexes, pour les autres cas on a intérêt à utiliser des questions fermées.
- Les questions directes ou indirectes : la question indirecte s’impose lorsqu’on veut aborder
des sujets délicats. Il est évident que la personne qui construira le questionnaire prendra des
décisions implicites ou explicites sur de différents types de questions.
A- Renseignements signalétiques :
B- Questions ouvertes :
Une question ouverte est une question dont la formulation laisse au répondant toute latitude pour
construire librement sa réponse et la donner avec ses propres mots.
Exemple :
La question « combien de films êtes-vous allé voir ce mois ? » est une question ouverte à
réponse numérique.
La question « de ce réalisateur, quels sont les films que vous connaissez ne serait-ce que de
nom ? » est une question ouverte à réponse textuelle.
Que pensez-vous de la manière dont le cours est donné ?
N.B.) La question est suivie d’un espace délimité destiné à recevoir la réponse, fournie librement par
l’enquêté.
Utilisation :
- Analyse exploratoire ;
- Analyse qualitative ;
- Formulation » naturelle » d’un problème ;
39
- Offre la possibilité d’exprimer tous les aspects d’une opinion, d’une motivation, d’une
conviction, d’une attitude, etc.
- Permet d’obtenir des données numériques précises ;
Avantages :
Pour l’enquêté :
Latitude dans le choix et la formulation des réponses ;
Possibilité de diversité et de nuance ;
Pour l’enquêteur :
Latitude dans la formulation de la question ;
Utile quand on ne connaît pas le champ des réponses possibles ou qu’il est très vaste ;
Inconvénients :
Pour l’enquêté :
Risque de mauvaise compréhension des questions ;
Possibilité de ne pas répondre complètement ;
Travail exigeant ;
Pour l’enquêteur :
Travail plus important de saisie des réponses ;
Plus grande difficulté de codage, analyse et interprétation ;
N.B.) Recours à des méthodes d’analyse spécifiques (analyse de contenu, analyse de
données textuelles, etc.).
C- Questions fermées :
L’ensemble des réponses possibles est proposé.
a) Types de questions fermées :
Question dichotomique :
Exemple : Possédez-vous un ordinateur ?
Oui
Non
Question à choix multiple à réponse unique :
Exemple : Combien avez-vous d’enfants ?
Zéro
Un
Deux
Trois ou plus
Question avec échelle d’évaluation :
Exemple : Quelle est votre opinion sur le l’entraineur de l’équipe nationale ?
Très mauvaise
Mauvaise
40
Bonne
Très bonne
Sans opinion
Une telle échelle peut comporter ou non une case » sans opinion ».
Le nombre de modalités peut varier.
Question avec réponses à cocher :
Exemple : Quel moyen de transport avez-vous utilisé hier ?
Voiture
Vélo
Autobus
Tram
Metro
Train
Avion
Autres
Il s’agit ici de donner un certain nombre de propositions et de demander aux interrogés de les classer
par ordre de préférence.
Exemple : Voici une liste de façons de préparer un examen de première année d’université. Vous êtes
invités à les classer par ordre d’efficacité en écrivant 1 dans la case située à côté de la méthode que
vous jugez la plus efficace, puis 2 pour celle que vous jugez la plus efficace en deuxième lieu et ainsi
de suite.
- Etudier dans le livre de référence
- Etudier dans ses notes prises au cours
- Etudier dans les notes d’un autre étudiant
- Consulter un ou plusieurs ouvrages à la bibliothèque
- Prendre un professeur particulier
- Chercher et résoudre les questions des années précédentes
- Etudier un seul chapitre et compter sur la chance
b) Avantages :
Pour l’enquêté :
Plus anonyme ;
41
Pour l’enquêteur :
Facilite de dépouillement, de codage et d’analyse ;
Moins couteux ;
Réponses plus consistantes ;
Peuvent servir de questions filtres.
Ex. : Possédez-vous un ordinateur ?
- Oui
- Non
Si OUI : quand l’avez-vous acheté ?
- Cette année
- L’an passe
- Il y a deux ans
- Il y a trois ans
- Il y a quatre ans ou plus
Si NON : pensez-vous en acheter prochainement ?
- Oui
- Non
c) Inconvénients :
Risque de trop simplifier un problème ;
Peut susciter une réponse non naturelle ;
Peut engendrer une réponse en l’absence de connaissance ou d’opinion ;
Peut engendrer une réponse valorisante ;
Les modalités proposées peuvent amener des non-réponses (liste non exhaustive, question
délicate,).
D- Questions semi-ouvertes (ou semi-fermées) :
Elles comportent des réponses proposées et offrent la possibilité d’ajouter des réponses libres.
Exemple : Pourquoi suivez-vous cet enseignement ?
- Parce qu’il m’est imposé dans un programme de cours ;
- Parce qu’il constitue un préalable à d’autres enseignements que je souhaite suivre ;
- Parce que le sujet m’intéresse ;
- Parce qu’il me permet d’améliorer une formation ;
- Parce qu’il me permettra d’avoir une promotion dans ma profession ;
- Autres raisons :
o ....................................
o ....................................
o ....................................
Caractéristiques :
42
- Utiles quand on ne maitrise qu’une partie du champ des réponses possibles ;
- Plus faciles `a manipuler que les questions ouvertes ;
- Permet de diminuer les non-réponses pour absence d’exhaustivité.
La validité d’une enquête dépend de la qualité des questions qui seront posées d’où l’importance à
accorder à la formulation qui doit prendre en compte le vocabulaire utilisé et la longueur du
questionnaire.
L’ordre du questionnaire : il convient d’aller du plus simple au plus délicat pour créer une certaine
forme de confiance entre l’enquêteur et l’enquêté. Les questions sociodémographiques n’arrivent
qu’en fin de questionnaire. La séquence doit être logique autrement dit ne pas changer souvent du
sujet et ne pas revenir sur des thèmes préalablement abordés.
La formulation des réponses : il faut s’assurer pour les questions fermées du principe d’exhaustivité
et s’assurer que l’ordre dont lequel les questions sont posés n’influencent pas les résultats.
Pour cela
Le choix des mots utilisés dans une question et sa formulation est important.
L’objectif d’une question est d’obtenir une réponse traduisant exactement ou le plus fidèlement
possible une réalité.
Elle doit être simple (utiliser des mots simples du langage courant parle) ;
Elle doit être claire et précisée (choisir des mots qui ont une seule signification et qui ne
peuvent être mal interprétés par l’enquêté) ;
43
Elle doit être courte et directe (craindre les négations et surtout ne pas utiliser de doubles
négations) ;
6. Agencement du questionnaire :
c) Premières questions : questions générales et simples, faciles à répondre. Il ne faut pas rebuter la
personne interrogée et lui faire renoncer à continuer.
44
- Il se peut qu’il existe un problème de compréhension des questions de la part des répondants.
b. Le téléphone :
Avantage :
- Grande dispersion géographique des répondants ;
- Rapidité de la collecte de l’information ;
- Taux de réponse est relativement élevé.
Inconvénients :
- Il faut une longueur limitée du questionnaire ;
- Les questions doivent être simples ;
- Problème d’échantillonnage peut se poser.
c. L’interview directe (face à face) :
Avantage :
- La présence de l’enquêteur permet de clarifier les questions et les répondants acceptent de
prendre du temps pour répondre ;
- Les informations collectées seront plus riches et plus fiables, et permettront un contrôle de
l’environnement de l’enquêté ;
Inconvénients :
- Coût élevé des enquêteurs ;
- L’honnêteté des enquêteurs ;
- L’enquêteur peut résumer des réponses et peut oublier une partie de ces réponses d’où un
biais dans l’information.
Chaque méthode a ces aspects positifs et négatifs, le choix sera fait en fonction de la nature du
problème à traiter et des moyens disponibles.
Nous considérons ici à la fois les erreurs réelles et les effets impliquant des réponses « incorrectes »,
« biaisées ».
2) Questions incompréhensibles.
45
« Êtes-vous favorable au rétablissement de la peine de mort ? »
5) Biais de réponse sur liste : l’ordre de présentation des réponses à une question fermée a un
effet sur les réponses.
N.B. : Pour mieux apprécier la proportion de personnes qui possèdent une « caractéristique
délicate », c’est-à-dire telle que certaines d’entre elles n’osent pas (ou ne veulent pas) affirmer au
grand jour qu’elles possèdent cette caractéristique, on peut recourir `a une méthode de réponses
aléatoires.
Enfin, on peut conclure que bâtir un questionnaire est un art, c’est la tâche la plus délicate de
l’enquête qui peut donner des fruits au travail ou bien peut nuire les résultats obtenus.
46