Vous êtes sur la page 1sur 51

Cours de Méthodologie d’Enquêtes

Chapitre 2 : La qualité dans les enquêtes

Héla OUAILI-MALLEK

ESSAI-MASE
hela.ouaili@yahoo.fr
https://essai.academia.edu/HelaOuailiMallek

2017-2018
Plan
Introduction
Les différentes étapes dans une enquête par sondage
Qualité de l’enquête
Qu’est-ce que la qualité d’une enquête ?
Les sources d’erreur dans une enquête par sondage
L’erreur d’échantillonnage
Précision des résultats :(cas du sondage aléatoire simple
Cas des sondages non aléatoires
Les méthodes de redressement
Les autre types d’erreurs
L’erreur de couverture
L’erreur de non-réponse
Le redressement des non-réponses
Redressement des non-réponses totales
Traitement des individus atypiques
Imputation des non-réponses partielles
Introduction 3

Introduction
Les différentes étapes dans une enquête par sondage
Qualité de l’enquête
Qu’est-ce que la qualité d’une enquête ?
Les sources d’erreur dans une enquête par sondage
L’erreur d’échantillonnage
Précision des résultats :(cas du sondage aléatoire simple
Cas des sondages non aléatoires
Les méthodes de redressement
Les autre types d’erreurs
L’erreur de couverture
L’erreur de non-réponse
Le redressement des non-réponses
Redressement des non-réponses totales
Traitement des individus atypiques
Imputation des non-réponses partielles
Introduction 4

Introduction

La qualité des résultats obtenus dans une enquête par


sondage dépend des choix effectués à chacune des étapes de
réalisation de l’enquête, et pas seulement du nombre de
réponses obtenues à l’enquête, même si ce dernier critère est
souvent utilisé comme critère unique de qualité, que ce soit
par ignorance ou par manque de connaissance sur la
méthodologie de l’enquête.
Introduction 5

Introduction(suite)

Le cadre théorique du cours de Théorie des Sondages correspond à


un modèle où chaque individu sélectionné dans l’échantillon peut
être joint (absence d’erreur de couverture) et accepte de
répondre à l’enquête et aux questions posée (absence d’erreur de
non-réponse totale et partielle), puis sait répondre, accepte de
répondre aux questions posées et donne la vraie réponse (absence
d’erreur de mesure).

Dans ce contexte il y a un seul type d’erreur, l’erreur


d’échantillonnage.
Introduction 6

Introduction(suite 2)

Dans la pratique les sources d’erreurs sont par exemple :

◮ le refus de participer à l’enquête,


◮ le répondant ne donne pas une réponse exacte à la question
posée,
◮ l’enquêteur ne respecte pas les consignes de passation du
questionnaire (définition erronée des termes employés dans le
questionnaire),
◮ les erreurs lors de la saisie.
Pour concevoir une enquête, évaluer et améliorer la qualité
des résultats d’enquête, nous devons connaı̂tre ces sources
d’erreur afin de savoir comment les prévenir et, a posteriori,
comment en diminuer l’impact sur les résultats, si cela est
possible.
Introduction 7

Introduction(suite 3)

En France, il existe des organismes chargés du contrôle de la


qualité des enquêtes. Ce sont principalement :
◮ la Commission des Sondages qui exerce un contrôle a
posteriori,
◮ le CESP 1 qui évalue la qualité des études de mesure
d’audience en contrôlant la méthodologie, la collecte des
données et les résultats,
◮ la société OCRD – STRATDEV, entreprise privée, qui est
spécialisée dans le contrôle des terrains d’enquêtes à la
demande de clients ou d’instituts.

1. Centre d’Etude des Supports de Publicité. Il s’agit d’une association com-


posée d’annonceurs, de supports et d’agences.
Les différentes étapes dans une enquête par sondage 8

Introduction
Les différentes étapes dans une enquête par sondage
Qualité de l’enquête
Qu’est-ce que la qualité d’une enquête ?
Les sources d’erreur dans une enquête par sondage
L’erreur d’échantillonnage
Précision des résultats :(cas du sondage aléatoire simple
Cas des sondages non aléatoires
Les méthodes de redressement
Les autre types d’erreurs
L’erreur de couverture
L’erreur de non-réponse
Le redressement des non-réponses
Redressement des non-réponses totales
Traitement des individus atypiques
Imputation des non-réponses partielles
Les différentes étapes dans une enquête par sondage 9

Les étapes dans une enquête par sondage

◮ Une enquête par sondage est une recherche d’informations,


auprès d’une fraction de la population étudiée, le plus souvent
au moyen d’un questionnaire ou parfois par observation directe
(ex : panels de téléspectateurs, panels de distributeurs, . . . ).
◮ La qualité des résultats d’enquête dépend des choix qui ont
été effectués à chacune des étapes de réalisation de l’enquête.
Les différentes étapes dans une enquête par sondage 10

Les étapes dans une enquête par sondage (suite)


(enquête par sondage via questionnaire)
1- La conception générale de l’enquête :
◮ définir les objectifs et les contraintes de l’enquête ( population
cible, informations que l’on souhaite obtenir, périodicité,
niveau de détail), s’assurer qu’il n’existe pas de données
secondaires,
◮ choisir la technique de collecte des informations (questionnaire
ou observation) en fonction de ces spécifications , des coûts et
délais ainsi que de l’existence ou non d’une base de sondage et
de la longueur du questionnaire.
◮ choisir le mode de collecte face-à-face par enquêteur à
domicile (si questionnaire long, complexe, si supports visuels,
si plusieurs questions ouvertes) sinon par téléphone ou
auto-administré. Le taux de réponse anticipé et la dispersion
géographique souhaitée contribuent à la décision.
◮ déterminer simultanément la méthode de sondage et la taille
de l’échantillon nécessaire.
Les différentes étapes dans une enquête par sondage 11

Les étapes dans une enquête par sondage (suite 2)

2- La rédaction proprement dite du questionnaire


En trois étapes : la première rédaction, le pré-test et la rédaction
définitive incluant le pré-codage du questionnaire.
3- L’administration du questionnaire
L’administration des questionnaires sur le ”terrain” est précédé par
un briefing des enquêteurs (sujet de l’étude, consignes
d’échantillonnage et de passation du questionnaire) et se termine
par le contrôle de la qualité du travail des enquêteurs (matérialité
des entretiens, bon respect des consignes de recrutement des
interviewés et de passation du questionnaire).
Les différentes étapes dans une enquête par sondage 12

Les étapes dans une enquête par sondage (suite 3)


4- Le traitement et l’analyse des résultats
Cette dernière étape comprend
◮ les opérations de vérification, de codage et de saisie (si
questionnaire-papier),
◮ le traitement éventuel des questions ouvertes,
◮ le calcul des poids de sondage et des coefficients de
redressement,
◮ le traitement informatique en général.
5- La diffusion des résultats les résultats de ces traitements
sont synthétisés dans un rapport final.
L’importance et la complexité de ces différentes phases
varient beaucoup d’une enquête à l’autre ; les choix opérés à
chacune des étapes ont une incidence directe sur la qualité
globale de l’enquête.
Qualité de l’enquête 13

Introduction
Les différentes étapes dans une enquête par sondage
Qualité de l’enquête
Qu’est-ce que la qualité d’une enquête ?
Les sources d’erreur dans une enquête par sondage
L’erreur d’échantillonnage
Précision des résultats :(cas du sondage aléatoire simple
Cas des sondages non aléatoires
Les méthodes de redressement
Les autre types d’erreurs
L’erreur de couverture
L’erreur de non-réponse
Le redressement des non-réponses
Redressement des non-réponses totales
Traitement des individus atypiques
Imputation des non-réponses partielles
Qualité de l’enquête 14

Qu’est-ce que la qualité d’une enquête ?


Pas de définition unique de la qualité des données d’enquête.

◮ Pour les statisticiens, elle est souvent assimilée à la


précision des résultats.
◮ Pour les utilisateurs des résultats, d’autres aspects sont
importants (la pertinence par rapport au problème posé et la
mise à disposition des données en temps voulu).
◮ Selon Eurostat, trois aspects de la qualité sont à considérer
pour l’évaluation de la qualité des données, les composantes
de la qualité du produit statistique, la perception par les
utilisateurs de la qualité des données et les
caractéristiques du processus de production.
Qualité de l’enquête 15

Qu’est-ce que la qualité d’une enquête ? (suite)

1- Eurostat évalue la qualité du produit statistique selon 6


dimensions :
◮ la pertinence (relevance),
◮ l’exactitude (accuracy),
◮ l’exactitude dans l’obtention des résultats et leur
diffusion (timeliness and punctuality),
◮ l’accessibilité et l’intelligibilité (accessibility and clarity) des
données statistiques,
◮ la comparabilité (comparability),
◮ la cohérence (coherence).

Une méthodologie d’enquête donnée ne peut pas optimiser


toutes les composantes de la qualité simultanément !
Qualité de l’enquête 16

Qu’est-ce que la qualité d’une enquête ? (suite 2)

Ces dimensions de la qualité se retrouvent dans les normes ou


codes de déontologie :
◮ la Norme NF ISO 20252 qui couvre l’ensemble du
déroulement de l’étude, et définit un référentiel assurant un
niveau minimum de qualité, de transparence, et de bonnes
relations entre le client et le prestataire,
◮ les codes de déontologie et directives ESOMAR (World
Association for Market, Social and Opinion Research) tels que
l’ESOMAR Guidelines for conducting survey research via
mobile phones (2011).
Qualité de l’enquête 17

Qu’est-ce que la qualité d’une enquête ? (suite 3)

2- la perception par les utilisateurs de la qualité des données


car ils ne privilégient pas les mêmes dimensions que les producteurs.
3- Il n’existe pas de définition standard pour la qualité du
processus de production. Mais elle peut être évaluée à travers
certains points :
◮ le choix d’une méthodologie adaptée aux objectifs de
l’étude,
◮ la réalisation du terrain selon les règles de l’art,
◮ le recours à des techniques d’analyse statistique
appropriées (poids de sondage, coefficients de redressement,
taille d’échantillon suffisante,. . . ).
Qualité de l’enquête 18

Les sources d’erreur dans une enquête par sondage

Le sens traditionnel de qualité est l’absence d’erreurs à chacune


des étapes de réalisation de l’enquête (conception, plan de
sondage, rédaction du questionnaire, terrain, analyses et
conclusion).
L’évaluation de la qualité d’une enquête passe par l’examen des
sources d’erreur possibles à chacune des étapes.
Qualité de l’enquête 19

Les sources d’erreur dans une enquête par sondage (suite)

Il existe deux groupes d’erreur :


◮ l’erreur d’échantillonnage (sampling error) qui décroit avec
l’augmentation de la taille de l’échantillon. Ces erreurs peuvent
être réduites a posteriori via les techniques de redressement.
◮ les autres types d’erreur (non sampling errors) qui
recouvrent essentiellement l’erreur de mesure et l’erreur de
non-réponse. Il est difficile de mesurer leur impact sur la
qualité des résultats. Ce n’est qu’avec l’expérience qu’on
apprend à les déceler, quelquefois les corriger ou les prévenir.
L’erreur d’échantillonnage 20

Introduction
Les différentes étapes dans une enquête par sondage
Qualité de l’enquête
Qu’est-ce que la qualité d’une enquête ?
Les sources d’erreur dans une enquête par sondage
L’erreur d’échantillonnage
Précision des résultats :(cas du sondage aléatoire simple
Cas des sondages non aléatoires
Les méthodes de redressement
Les autre types d’erreurs
L’erreur de couverture
L’erreur de non-réponse
Le redressement des non-réponses
Redressement des non-réponses totales
Traitement des individus atypiques
Imputation des non-réponses partielles
L’erreur d’échantillonnage 21

L’erreur d’échantillonnage

La théorie des sondages nous permet le calcul de l’erreur


d’échantillonnage pour tous les sondages aléatoires, même
les plus complexes. Ces erreurs peuvent être réduites a
posteriori via les techniques de redressement.
◮ Les sondages aléatoires ont 3 avantages majeurs : (la
possibilité de calculer une marge d’erreur sur les résultats,
l’absence de biais de sélection de l’échantillon, la connaissance
des taux de réponse fournit un critère d’appréciation de la
qualité des résultats.
◮ Les inconvénients des sondages aléatoires sont
principalement : la nécessité d’une base de sondage au moins
partielle, le coût élevé et les longs délais de réalisation en
raison des relances et revisites.
L’erreur d’échantillonnage 22

L’erreur d’échantillonnage (suite)

La précision des résultats dans un sondage aléatoire simple


est si facile à calculer qu’elle sert souvent d’approximation
◮ pour les méthodes complexes dans le cas d’erreurs de
non-réponse et d’erreurs de mesure rendant illusoire un calcul
exact de la précision ,
◮ pour les méthodes de sondages empiriques.
L’erreur d’échantillonnage 23

Précision des résultats : cas du sondage aléatoire simple

Pour estimer la moyenne µ de la variable d’intérêt Y , un SAS de


taille n > 30, dans une population de taille N, l’intervalle de
confiance de niveau 95% est estimé par
 r r 
s n s n
IC0.95 (µ) = y − 1.96 √ 1− , y + 1.96 √ 1−
n N n N

s étant une estimation de l’écart-type de la population.


L’erreur d’échantillonnage 24

Précision des résultats : cas du sondage aléatoire simple


(suite)

Si
p le taux de sondage est inférieur à 10% (et donc
1 − Nn > 0.949 ≃ 1 ),
l’intervalle de confiance de niveau 95% est alors
 
s s
IC0.95 (µ) = y − 1.96 √ , y + 1.96 √
n n

Ainsi, pour un taux de sondage inférieur à 10%, la précision


du sondage ne dépend pas du taux de sondage !
L’erreur d’échantillonnage 25

Précision des résultats : cas du sondage aléatoire simple


(suite 2)
Si p est la proportion d’individus de la population possédant un
caractère donné, la taille d’échantillon nécessaire pour estimer µ
n
et/ou p avec une précision inférieure à d donnée et pour
N
négligeable :

(1.96)2 2
n ≥ s
d2
(1.96)2
n ≥ b
p (1 − b
p)
d2
où b
p est la proportion estimée d’individus possédant le
caractère étudié .
La précision donnée par le demi-intervalle de confiance ne fait
référence qu’à l’erreur d’échantillonnage et pas aux autres
types d’erreur !
L’erreur d’échantillonnage 26

Cas des sondages non aléatoires

◮ Les probabilités d’inclusion ne sont pas connues et peuvent


être nulles pour certains individus ; d’où un biais de sélection
(la rareté des bases de sondage et les coûts et délais nous y
contraignent !)
◮ Impossible de calculer les marges d’erreur.
L’erreur d’échantillonnage 27

La méthode des quotas

L’échantillon obtenu est représentatif de la population par


rapport aux variables de quotas mais rien n’indique qu’il soit
représentatif sur d’autres critères et sur les variables qui font l’objet
de l’étude.
◮ Les quotas doivent être liés au sujet étudié.
◮ Ils ne doivent pas être très nombreux pour ne pas
encourager les enquêteurs à tricher.
L’erreur d’échantillonnage 28

La méthode des quotas (suite)


Pour améliorer La fiabilité des résultats d’une enquête par quotas
(à domicile en face à face), il est nécessaire de
◮ procèder à un tirage aléatoire des délégations et/ou
districts,
◮ contrôler le travail des enquêteurs par contre-enquête,
◮ restreindre la liberté de choix des enquêteurs en ajoutant des
consignes à la feuille de quotas,
◮ pas plus d’une interview par immeuble, pas plus d’une maison
par rue,
◮ varier les étages dans lesquels sont réalisées les interviews,
◮ changer de district ou de quartier après chaque enquête,
◮ varier la répartition des interviews dans la journée et en soirée.
L’erreur d’échantillonnage 29

Inconvénients du sondage par quotas

◮ Le biais dû au nombre de refus qu’a confronté l’enquêteur car


ces refus altèrent la représentativité.
◮ Impossibilité de calculer les marges d’erreur. On donne
généralement comme approximation grossière, les marges
d’erreur du SAS.
L’erreur d’échantillonnage 30

Les méthodes de redressement

Elles sont utilisées a posteriori, pour réduire l’erreur


d’échantillonnage et/ou l’erreur de non-réponse (méthodes de
repondération).
Elles ont pour objectifs de :
◮ améliorer la précision des estimations,
◮ rendre la structure de l’échantillon (si des différences sont
constatées) identique à celle de la population pour certaines
variables (connues) corrélées à la variable d’intérêt en
affectant des poids aux réponses des interviewés dans
l’analyse des résultats,
◮ corriger partiellement le biais dû aux non-réponses .
L’erreur d’échantillonnage 31

Les méthodes de redressement (suite)

Si le sondage est à probabilités inégales, on introduit aussi les


poids de sondage dans l’analyse des résultats (le poids de
sondage est l’inverse de la probabilité d’inclusion).
Il existe de nombreuses méthodes de redressement :

◮ la post-stratification
◮ la méthode de calage généralisé qui convient pour
déterminer un poids unique par individu

Le redressement sur critères multiples est utilisé dans toutes les


grosses enquêtes.
Les autre types d’erreurs 32

Introduction
Les différentes étapes dans une enquête par sondage
Qualité de l’enquête
Qu’est-ce que la qualité d’une enquête ?
Les sources d’erreur dans une enquête par sondage
L’erreur d’échantillonnage
Précision des résultats :(cas du sondage aléatoire simple
Cas des sondages non aléatoires
Les méthodes de redressement
Les autre types d’erreurs
L’erreur de couverture
L’erreur de non-réponse
Le redressement des non-réponses
Redressement des non-réponses totales
Traitement des individus atypiques
Imputation des non-réponses partielles
Les autre types d’erreurs 33

Les autre types d’erreurs : L’erreur de couverture

◮ Elle provient essentiellement de la différence entre la valeur


du paramètre sur la population cible et celle sur la base
de sondage (population source).
◮ La base de sondage est, en pratique, très souvent imparfaite.
◮ On suppose, généralement, que la proportion de hors-champ
dans l’échantillon est identique dans la population .
◮ Le biais résultant de l’erreur de couverture est généralement
apprécié qualitativement.
Les autre types d’erreurs 34

L’erreur de couverture (suite)

Figure : Champ et base de sondage


Les autre types d’erreurs 35

L’erreur de non-réponse

La non-réponse, différente du hors champ, peut être


◮ soit totale
◮ soit partielle

A partir de 80% de non réponse dans le questionnaire, on


considère qu’il y a non-réponse totale.
Les taux de réponse diffèrent selon le thème de l’enquête (
enquête-santé, enquête publique, enquête en face-à-face : meilleur
taux de réponse),
Pour les non-réponses partielles, les réponses aux autres questions
du questionnaire donnent souvent des pistes d’explication
exploitées par les méthodes d’imputation.
Les autre types d’erreurs 36

L’erreur de non-réponse (suite)

◮ Le biais du aux réponses manquantes dans une enquête


dépend à la fois du taux de non-réponse et de l’écart
entre les comportements des répondants et des
non-répondants en ce qui concerne la variable d’intérêt (ce
biais ne diminue pas avec l’augmentation de la taille
d’échantillon.).
◮ La non-réponse entraine également une perte de précision :
les résultats sont calculés sur un nombre de répondants
inférieur à la taille d’échantillon prévue. Cette perte peut être
anticipée en estimant a priori le taux de non-réponse probable.
Les autre types d’erreurs 37

L’erreur de non-réponse (suite 2)

Un taux de non-réponse faible peut entrainer un biais important si


répondants et non-répondants ont des comportements très
différents en ce qui concerne les thèmes de l’enquête.

Inversement, un taux de non-réponse élevé n’est pas trop grave si


ces comportements sont très voisins.

Si les individus sont nommément désignés, les non- répondants


peuvent même être classés par catégorie.
Pour les panels, les non-répondants sont bien identifiés et on peut
corriger l’effet des non- réponses et/ou estimer les réponses
manquantes.
Les autre types d’erreurs 38

Le redressement des non-réponses


La réduction de l’erreur de non-réponse peut se faire au niveau
des techniques de collecte
◮ adapter le questionnaire, sa forme et sa longueur, au mode de
collecte,
◮ l’enquêté doit pouvoir facilement répondre au questionnaire,
◮ former les enquêteurs à la prise de contact avec les individus
sélectionnés,
◮ effectuer des revisites (enquêtes à domicile), des rappels
(enquêtes par téléphone),
◮ envisager éventuellement une récompense ou rémunération
pour les réponses,

Malgré toutes ces précautions, il est souvent nécessaire de corriger


l’erreur de non-réponse a posteriori.
Les autre types d’erreurs 39

Redressement des non-réponses totales

Dans le cas d’une non-réponse totale, la correction peut être


effectuée via l’extrapolation ou la repondération ou la
modélisation ou encore la post-stratification.
◮ L’extrapolation : affecter à chaque non-répondant total (le
receveur), un donneur sous certaines conditions :
i- un individu ne peut être donneur qu’une seule fois,
ii- le donneur et le receveur appartiennent à un groupe homogène,
iii- les individus atypiques ne doivent pas être concernés.
La précision n’est pas altérée par les non-réponses mais il y
a risque de biais. L’extrapolation doit donc être détectable
dans le fichier de données.
Les autre types d’erreurs 40

Redressement des non-réponses totales (suite)

◮ La repondération de l’échantillon des répondants : remplacer


les poids de sondage par des poids de redressement
(hypothèse : dans chaque catégorie définie par les variables de
redressement connues pour toute la population, répondants
et non-répondants ont en moyenne le même profil).
Et si le poids de sondage initial dans la catégorie était
1 nh
= ,
ω h1 Nh
1 nhR
alors le poids de sondage final est = ,
ω h2 Nh
où nhR désigne le nombre de répondants dans la catégorie h.
La repondération permet de réduire le biais dû à la
non-réponse mais pas nécessairement la variance.
Les autre types d’erreurs 41

Redressement des non-réponses totales (suite 2)

◮ La modélisation de la non-réponse totale par un modèle


logistique :
 pi = P [Yi = 1]
1 si i ∈ R  pi
Yi = ln = α′ Xi + εi
0 si i ∈
/R i ∈R
1 − pi
X : vecteur de variables exogènes connues pour les répondants
et les non-répondants et disponible dans la base de données
(forme juridique, forme de propriété, région).
Une régression logistique par strate est préférable
Si le modèle logistique mène à une variable significative, la
repondération se fera selon cette variable. Si plusieurs
variables sont significatives, on optera pour celle ayant la
probabilité marginale la plus élevée.
Les autre types d’erreurs 42

Traitement des individus atypiques

◮ Les individus atypiques ne doivent pas avoir le même poids


de sondage que les autres individus. Sinon risque de
sur-évaluation de l’estimateur.
Prédire les individus atypiques est nécessaire pour une
estimation robuste.
Plusieurs méthodes de prédiction
i- déterministes ( algébriques ou graphiques)
ii- probabilistes (lois de probabilité, tests statistiques, théorie des
valeurs extrêmes.
En pratique, on a plutôt tendance à recourir aux méthodes
déterministes.
Les autre types d’erreurs 43

Traitement des individus atypiques (suite)


◮ La distance relative de l’individu au centre de la
distribution est souvent utilisée pour détecter les individus
atypiques :
|xi − Me |
di = MAD = median {|xi − median
j (xj )|}
MAD
MAD (Median Absolute Deviation) désigne la médiane des
écarts à la médiane.
◮ Graphiquement, le box-plot permet de détecter les individus
atypiques. L’individu est atypique si

xi < LF ou xi > LU
LF = Q1 − k1 (Q3 − Q1 ) , et LU = Q3 + k2 (Q3 − Q1 )
k1 et k2 déterminés empiriquement à partir de la connaissance
de la fonction de répartition de X et du nombre
d’observations.
Les autre types d’erreurs 44

Traitement des individus atypiques (suite 2)

◮ Il existe d’autres méthodes empiriques telles que celle basée


sur la variance.
◮ Le traitement des individus atypiques reste complexe car si l’on
considère ω = 1, on suppose qu’il est seul dans sa catégorie,
les autres ω i changent et un problème de biais se pose.
Et si l’on écarte l’individu atypique, on change le champ de
l’enquête, ce qui n’est pas toujours pertinent !
Les autre types d’erreurs 45

Imputation des non-réponses partielles

Elle consiste à remplacer chaque donnée manquante par une


donnée ”prédite en fonction des informations obtenues pour
le même individu et pour des individus proches.
Deux grandes classes de méthodes d’imputation :
◮ déterministe : la valeur imputée ne change pas si l’on
relance la procédure d’imputation (souvent suffisantes si on
travaille sur une moyenne ou un total) ,
◮ aléatoire : la valeur imputée change si l’on relance la
procédure d’imputation.
L’imputation peut être effectuée dans un cadre univarié ou
multivarié (peu recommandé en pratique).
Les autre types d’erreurs 46

Imputation des non-réponses partielles (suite)

La procédure doit commencer par la variable ayant le moins de


valeurs manquantes et s’il en existe 2 identiques, on commencera
par la plus importante pour l’enquête. Plusieurs méthodes
déterministes :
◮ l’équation comptable,
◮ la tendance auxiliaire (faire évoluer la variable selon la
tendance sur l’année d’une autre variable qui lui est corrélée,
◮ la moyenne dans la strate,
◮ la régression linéaire modèle estimé sur l’échantillon des
répondants puis imputé pour les non-répondants.
◮ le plus proche voisin,
Les autre types d’erreurs 47

Imputation des non-réponses partielles (suite 2)


Les méthodes stochastiques sont plus coûteuses mais
impératives si les méthodes empiriques déforment la distribution
(cas des fréquences).
Les méthodes stochastiques les plus courantes sont :

◮ le cold deck : la valeur manquante est remplacée par la


valeur d’un répondant tirée au hasard dans le fichier d’une
enquête antérieure et dans la même strate,
◮ le hot deck : la valeur manquante est remplacée par une
valeur tirée aléatoirement dans la même strate,
◮ la régression linéaire : les coefficients du modèle sont
estimés sur l’échantillon des répondants et imputés pour les
non-répondants avec une composante aléatoire
εi N (0, 1) .
Les autre types d’erreurs 48

Imputation des non-réponses partielles (suite 3)

◮ Après imputation, ajouter à la variance d’échantillonnage, la


variance des imputations,
◮ Vérifier la qualité de l’imputation (cohérence avec les
autres variables et comparaison avec des données externes),
◮ Pour des variables différentes, les méthodes d’imputation ne
sont pas nécessairement les mêmes.
La mesure et le suivi des taux de réponse dans les enquêtes
répétitives permettent de surveiller la qualité et d’apprécier
les difficultés de réalisation de l’enquête sur le terrain et
donc de modifier les consignes et les horaires d’interview et
de suivre l’impact de ces modifications.
Les autre types d’erreurs 49

L’erreur de mesure (ou d’observation)


Elle provient d’écarts entre les réponses des interviewés et les
vraies valeurs. Elle peut être due à

◮ l’enquêteur (d’où la nécessité de former, encadrer sur le


terrain et contrôler les enquêteurs),
◮ l’instrument de mesure (questionnaire et ou mode de
collecte des données). Les enquêtes CATI, CAPI et CAWI
contribuent à l’amélioration de la qualité des données
(réduction du temps de collecte, gestion des rendez-vous et
relances, mesure des durées d’administration, réduction de la
monotonie et contrôle des enquêteurs),
◮ l’interviewé (volontairement ou involontairement),
◮ le système d’information,
◮ l’environnement.
Les autre types d’erreurs 50

Conclusion

D’autres erreurs peuvent se produire : erreurs de codage et de


saisie, erreurs liées à l’imprécision des informations utilisées
pour la construction de l’échantillon.
◮ Les erreurs de mesure sont mieux maitrisées grâce aux
nouvelles technologies de collecte d’information (ordinateurs,
audimètres, lecteurs de codes à barre dans les panels de
consommateurs et de distributeurs,. . . )
◮ Les erreurs de non-réponse affichent une hausse.
◮ Les erreurs de couverture se sont dégradées (enquêtes par
téléphone et internet).
Les autre types d’erreurs 51

Conclusion (suite)
Erreur totale= Erreur d’échantillonnage + autres types
d’erreur
L’erreur totale doit être minimisée compte tenu des contraintes de
coût et de délais.

Objectifs de l’évaluation de la qualité dans les enquêtes :


◮ identifier les sources d’erreur et corriger l’impact de ces
erreurs,
◮ faire progresser cette qualité au cours de la réalisation de
l’enquête ou dans une enquête ultérieure,
◮ fournir aux utilisateurs de données une évaluation de la
qualité des résultats d’enquête.
Le processus d’évaluation peut être conduit lors de chacune
des étapes de l’enquête.

Vous aimerez peut-être aussi