Académique Documents
Professionnel Documents
Culture Documents
Methoologie Enquetes
Methoologie Enquetes
METHODOLOGIE D’ENQUÊTES
PLAN DU CHAPITRE 11
11.1 LE QUESTIONNAIRE
11.1.1 Qu’est-ce qu’un questionnaire ?
11.1.2 Etapes de la construction d’un questionnaire
11.1.3 Règles de base pour l’élaboration du questionnaire
11.1.4 Types de questions
11.1.5 Formulation des questions
11.1.6 Agencement du questionnaire
11.1.7 Les erreurs induites par le questionnaire
1
11.1 LE QUESTIONNAIRE
a) Définitions préalables
• Objectifs du questionnaire
• Population concernée
• Mode de consultation
d) Enquête pilote
2
11.1.3 Règles de base pour l’élaboration du questionnaire
• Distinguer les catégories d’information recherchées :
faits, connaissances, opinions, attitudes ou comportements, convic-
tions, motivations, . . .
• Pertinence et utilité des questions
• Motiver et faciliter la tâche de l’enquêté avant de simplifier celle
du chargé d’études
• Souci d’objectivité (neutralité)
• Tenir compte du mode de consultation utilisé (par enquêteur,
enquête postale, par téléphone, . . . )
• Penser aux étapes ultérieures : dépouillement, codification, saisie,
vérifications, traitements, . . .
1) Renseignements signalétiques
2) Questions ouvertes
a) Exemple
Que pensez-vous de la manière dont le cours est donné ?
N.B.) La question est suivie d’un espace délimité destiné à recevoir la
réponse, fournie librement par l’enquêté.
3
b) Utilisation
• Analyse exploratoire
• Analyse qualitative
• Formulation ”naturelle” d’un problème
• Offre la possibilité d’exprimer tous les aspects d’une opinion,
d’une motivation, d’une conviction, d’une attitude, . . .
• Permet d’obtenir des données numériques précises
c) Avantages
c.1) Pour l’enquêté :
• Latitude dans le choix et la formulation des réponses
• Possibilité de diversité et de nuance
c.2) Pour l’enquêteur :
• Latitude dans la formulation de la question
• Utile quand on ne connaı̂t pas le champ des réponses possibles
ou qu’il est très vaste
d) Inconvénients
c.1) Pour l’enquêté :
• Risque de mauvaise compréhension des questions
• Possibilité de ne pas répondre complètement
• Travail exigeant
c.2) Pour l’enquêteur :
• Travail plus important de saisie des réponses
• Plus grande difficulté de codage, analyse et interprétation
N.B.) Recours à des méthodes d’analyse spécifiques (analyse de
contenu, analyse de données textuelles, . . . )
4
3) Questions fermées
5
• Le nombre de modalités peut varier.
Ex. :
6
a.4) Question avec réponses à cocher
Ex. : Quel moyen de transport avez-vous utilisé hier ?
Voiture
Vélo
Autobus
Tram
Métro
Train
Avion
Autre
N.B.) On peut dans ce cas cocher toutes les cases pertinentes.
7
a.5) Question avec classement
Il s’agit ici de donner un certain nombre de propositions et de demander
aux interrogés de les classer par ordre de préférence.
Ex. : Voici une liste de façons de préparer un examen de première
année d’université. Vous êtes invités à les classer par ordre d’efficacité
en écrivant 1 dans la case située à côté de la méthode que vous jugez
la plus efficace, puis 2 pour celle que vous jugez la plus efficace en
deuxième lieu et ainsi de suite.
Etudier dans le livre de référence
Etudier dans ses notes prises au cours
Etudier dans les notes d’un autre étudiant
Consulter un ou plusieurs ouvrages
à la bibliothèque
Prendre un professeur particulier
Chercher et résoudre les questions
des années précédentes
Etudier un seul chapitre
et compter sur la chance
N.B.) On peut ne demander d’indiquer que les 3 ou 4 premières
méthodes choisies.
8
b) Avantages
b.1) Pour l’enquêté :
• Facile à répondre, souvent rapide
• Plus anonyme
b.2) Pour l’enquêteur :
• Facilité de dépouillement, de codage et d’analyse
• Moins coûteux
• Réponses plus consistantes
• Peuvent servir de questions filtres
Ex. : Possédez-vous un ordinateur ?
Oui
Non
Si OUI : quand l’avez-vous acheté ?
Cette année
L’an passé
Il y a deux ans
Il y a trois ans
Il y a quatre ans ou plus
Si NON : pensez-vous en acheter prochainement ?
Oui
Non
9
c) Inconvénients
• Risque de trop simplifier un problème.
• Peut susciter une réponse non naturelle.
• Peut engendrer une réponse en l’absence de connaissance ou
d’opinion.
• Peut engendrer une réponse valorisante.
• Les modalités proposées peuvent amener des non-réponses (liste
non exhaustive, question délicate, . . . )
10
• Caractéristiques :
– Utiles quand on ne maı̂trise qu’une partie du champ des réponses
possibles.
– Plus faciles à manipuler que les questions ouvertes.
– Permet de diminuer les non-réponses pour absence d’exhaustivité.
11
11.1.5 Formulation des questions
12
11.1.6 Agencement du questionnaire
a) Introduction et demande de collaboration
Transparence de l’origine de l’enquête et des objectifs.
b) Renseignements d’identification
Nom, adresse, sexe, . . .
c) Premières questions
Questions générales et simples, faciles à répondre. Il ne faut pas
rebuter la personne interrogée et lui faire renoncer à continuer.
d) Enchaı̂nement des questions
1) Rassembler les questions par thème.
2) Les premières questions d’un thème doivent être suffisamment
larges pour que l’on soit certain que la population visée soit
incluse dans ce premier ensemble. Ensuite, par une série de
questions plus précises, on définit une partition de ce dernier
et on délimite précisément la cible.
3) Intercaler entre les questions difficiles des questions plus fa-
ciles, dites questions ”de repos”.
4) Veiller à la cohérence, aux liaisons entre thèmes, aux redon-
dances, aux contrôles.
5) Etre attentif à la longueur du questionnaire.
13
11.1.7 Les erreurs induites par le questionnaire
Nous considérons ici à la fois les erreurs réelles et les effets impliquant
des réponses ”incorrectes”, ”biaisées”.
a) Erreurs dues au questionnaire
1) Questions fermées avec liste de réponses non exhaustive.
2) Questions incompréhensibles.
3) Questions suggérant des réponses.
Ex. : Que préférez-vous de ces deux éventualités ?
Que Monsieur X soit nommé président.
Que la guerre civile éclate.
4) Effet de halo : influence d’une question sur la question sui-
vante.
Ex. :
– ”Pensez-vous que la grande criminalité soit en progression ?”
– ”Etes-vous favorable au rétablissement de la peine de mort ?”
5) Biais de réponse sur liste : l’ordre de présentation des réponses
à une question fermée a un effet sur les réponses.
14
– Gêne pour répondre
– Défaillances de la mémoire
– Refus de répondre
– Désir de saboter l’enquête
– ...
15
11.2 LA COLLECTE DES DONNEES
a) Auto-dénombrement
• L’information requise est fournie par le répondant qui complète
lui-même le questionnaire.
• Avantages :
+ Bonne couverture
+ Coût moins élevé
+ Meilleure confidentialité
+ Plus de temps pour répondre (si nécessaire)
16
• Désavantages :
− Taux de réponse faible
− Impersonnel
− Pas indiqué pour les analphabètes ou quasi-illettrés
• Modes de livraison :
- mise à la poste / retour par la poste (fax)
- livraison par une personne / retour par la poste (fax)
- livraison par une personne / reprise par une personne
b) Entrevue personnelle
• L’information requise est obtenue par une visite personnelle au
lieu de résidence (enquête sociale) ou au lieu de travail (enquête
entreprises).
• Avantages :
+ Taux de réponse élevé
+ Contact personnel avec le répondant
+ Permet de faire des observations
+ Permet la prise de mesures directes
• Désavantages :
− Coût élevé
− Formation des enquêteurs
− Déplacement des enquêteurs
17
c) Entrevue téléphonique
• L’information requise est obtenue par un contact téléphonique
avec le répondant.
• Avantages :
+ Permet un contact direct
+ Moins coûteuse et plus rapide qu’une entrevue personnelle
+ Compromis entre une visite et la poste
+ Centralisée
• Désavantages :
− Pas d’informations visuelles
− Problème éventuel de couverture de la population
(toutes les unités de la population sont-elles contactables par
téléphone ? . . . )
− Formation des enquêteurs
− Confidentialité
− Taux de réponse inférieur à l’entrevue personnelle
19
11.2.2 Facteurs influençant le choix d’une méthode de collecte
- Objectifs de l’enquête
- Disponibilité des bases de sondage
- Caractéristiques de la population cible
- Complexité des concepts
- Nature des questions
- Qualité des données requise (taux de non-réponse)
- Coût
- Echéancier
- Ressources disponibles (facilité d’exploitation)
20
11.2.3 Travail à faire durant la collecte
• Identifier les membres de l’échantillon
• Dépistage des unités de l’échantillon :
- nécessaire pour suivre les unités qui déménagent, changent de
nom, etc.
- coûteux mais requis pour la longitudinalité
- différencie les non-répondants des unités hors-champ
• Appliquer les procédures de collecte et de dépouillement
• Contrôler la collecte :
- rapidité des retours
- rappels si nécessaire
• Vérification des réponses
21
11.2.4 Mesures à mettre en oeuvre pour améliorer le taux de réponse
a) A l’étape de la conception
• Choisir une bonne méthode de collecte
• Anticiper le taux de non-réponse
• Tester les questions
• Avoir un bon questionnaire
• Avoir une bonne base de sondage
• Lettres d’information sur l’enquête ou rapports sur les résultats de
l’enquête (à la suite de l’enquête)
b) A l’étape de la collecte
• Etablir un bon contact avec le répondant
• Susciter l’intérêt du répondant
• Bien former les intervieweurs
• Superviser adéquatement le déroulement de la collecte
• Argent ou cadeaux
22
11.3 SOURCES D’ERREUR DANS UNE ENQUÊTE
Elle est due au fait que certains individus dans la population ont une
probabilité nulle de figurer dans l’échantillon.
23
11.3.2 Erreur due à la non-réponse
• Elle est présente si l’on ne peut pas réaliser l’enquête auprès de tous
les individus de l’échantillon qui a été constitué.
Causes :
refus, non-contact, inaptitude, invalidité de la réponse, destruction des
documents, . . .
24
Le traitement des non-réponses intégrales se pose différemment selon
que l’on se situe :
- dans une méthode empirique (méthode des quotas) où l’on ne
possède pas d’information, en général, sur les non-répondants ;
- dans une méthode aléatoire où l’on connaı̂t le nombre et, parfois,
les causes des non-réponses ;
- dans un panel où on a beaucoup d’informations sur les non-
répondants.
26
• Redressement pour non-réponses
a) Relance des non-répondants (méthode de Hansen)
Parmi les n individus sélectionnés pour l’échantillon, n1 ont répondu
au questionnaire et n2 n’ont pas répondu.
Parmi ces n2 non-répondants, on tire de façon équiprobable et sans
remise un sous-échantillon s02 de taille n02 = λn2 (0 < λ < 1), et on
s’arrange pour obtenir les réponses des n02 individus réenquêtés.
L’estimateur de Hansen est
n1 n2 0
yH = y1 + y
n n 2
où
y aurait été la moyenne de l’échantillon initial si celui-ci avait été
complet
y 1 est la moyenne parmi les n1 répondants (avant la relance)
y 2 est la moyenne qui résulterait des observations auprès des n2
non-répondants ; y 2 est inconnue mais peut être approchée par
y 02, la moyenne parmi les n02 individus qui ont répondu suite à la
relance.
L’étude des propriétés de y H prend en compte le fait que la procédure
repose sur 2 niveaux d’aléas :
1) n est fixé mais aléas sur le nombre n2 de non-répondants et sur
les individus qui seront non-répondants ;
2) n2 est connu au moment de la relance mais aléas sur les n02 indi-
vidus qui seront sélectionnés lors de cette relance.
On montre que
E(y H ) = µ (non biais)
27
N.B.) On peut aussi étudier le cas de relances successives.
On montre que
E(y REDR) = µ (non biais)
28
Remarques :
• Dans ce type de méthodes, on estime, classe par classe, le com-
portement des non-répondants grâce à celui des répondants.
• On peut généraliser cette méthode au cas de plusieurs critères de
pondération par l’utilisation d’algorithmes dits de redressement
sur critères multiples.
29
- Ne peut pas être appliquée dans le cas de variables quali-
tatives.
- Variante :
* Diviser préalablement l’ensemble des répondants en classes
d’imputation pour ensuite calculer les moyennes à l’intérieur
de celles-ci.
* On doit savoir à quelle classe d’imputation appartient
chaque unité non répondante (difficile si l’information
est tirée de l’entrevue elle-même).
a.2) ”Hot deck”
- Consiste à tirer au hasard un des répondants de l’échantillon
que l’on appelle alors un donneur ; les valeurs des variables
du donneur sont ensuite assignées à un non-répondant
donné.
- Particulièrement utile parce qu’elle assigne automatique-
ment aux non-répondants des valeurs cohérentes provenant
directement des répondants.
- Fonctionne autant pour les variables quantitatives que qua-
litatives.
- Peut s’employer à l’intérieur des classes d’imputation.
a.3) ”Cold deck”
Elle diffère du ”hot deck” par le fait qu’elle choisit le don-
neur au sein d’une source de données externe (Ex. : données
administratives ou enquêtes précédentes)
30
a.4) Imputation multiple
- Consiste à imputer, pour un non-répondant donné, différentes
valeurs ; les estimations sont alors calculées en utilisant un
ou plusieurs des ensembles de données produits.
Ex. : plusieurs imputations par ”hot deck”
- Permet de mesurer la variabilité des estimations introduite
par l’utilisation de valeurs imputées.
- Peu employée en pratique, principalement à cause de la
multiplication des ensembles de données.
31
b.2) Imputation par le plus proche voisin
- Le donneur est choisi en prenant celui qui se trouve le plus
proche selon une distance calculée en utilisant une ou plusieurs
des variables connues.
- Préserve assez bien la structure des données puisque l’on choi-
sit le donneur ressemblant le plus à l’unité pour laquelle une
valeur doit être imputée.
Important ! !
Identifier dans les ensembles de données les variables où il y a eu
imputation afin de bien tenir compte du fait qu’une partie des valeurs
proviennent non pas des unités interrogées mais d’une assignation par
imputation.
32
c) Imputation pour les panels
• Pour les panels, les méthodes d’imputation doivent tenir compte
des données des vagues précédentes et suivantes, en plus de la
vague courante.
• Utiliser seulement les données de la vague courante peut créer des
changements (ou transitions) artificiels.
• Utiliser les données des vagues précédentes et suivantes seulement
peut sous-représenter les changements.
• Méthodes d’imputation utilisables :
- imputation par le plus proche voisin (imputation par donneur)
en utilisant les données des vagues précédentes, suivantes et
actuelle pour aider à trouver le donneur ;
- imputation par modélisation en utilisant des variables auxi-
liaires provenant des vagues précédentes, suivantes et actuelle.
• Exemple :
Valeurs pour i Vague 1 Vague 2 Vague 3
Ventes 10 000 ? 11 000
Profits 15 000 30 000 16 000
Moyenne 25 000 50 000 30 000
des ventes
- Imputation par la moyenne :
ventes imputées = 50 000
(pas plausible si comparées aux vagues 1 et 3)
33
- Imputation historique :
ventes imputées = 10 500
(pas plausible si comparées à la moyenne des ventes pour
la vague 2 et également si les profits sont corrélés avec les
ventes)
- Solutions utilisant les données des vagues précédentes, sui-
vantes et actuelle :
a) Modèle 1 :
Ventes = α + β(moyenne des ventes) + erreur
= 5 000 + 0.2(moyenne des ventes) + erreur
(α et β sont estimés sur base des vagues précédentes et
suivantes)
⇒ ventes imputées = 5 000 + 0.2(50 000) = 15 000
b) Modèle 2 :
Ventes = α + β(profits) + erreur
= -5 000 + profits + erreur
(α et β sont estimés sur base des vagues précédentes et
suivantes)
⇒ ventes imputées = -5 000 + 30 000 = 25 000
34
11.3.3 Erreur d’échantillonnage
36