Vous êtes sur la page 1sur 36

Chapitre 3 - Introduction au plan

d'enquête
Introduction

Lorsque les objectifs de l'enquête sont clairement définis, voici les questions importantes à
poser :
1. faut-il faire une enquête-échantillon ou un recensement?
2. La population qui intéresse le client peut-elle faire l’objet d’une enquête?
3. Quelles peuvent être les principales sources d’erreur dans l'enquête et leurs répercussions sur les
résultats?

•De nombreux éléments aident à répondre à 1.:


(1) le budget et les ressources disponibles (2) la taille de la population et des sous-populations intérêt,
(3) l’échéancier des résultats de l'enquête.
2. Avant de choisir une base de sondage en particulier, il faut évaluer la qualité de diverses
bases éventuelles pour déterminer en particulier laquelle couvre le mieux à la population cible.

3. Une enquête peut présenter deux genres d’erreur :


•L’erreur d’échantillonnage est possible seulement dans l'enquête-échantillon.
•L’erreur non due à l’échantillonnage est possible dans l'enquête-échantillon et le recensement:
un certain nombre de raisons peuvent l’expliquer : la base de sondage est incomplète, certains répondants
n’ont pas déclaré correctement les données, des données de certains répondants peuvent manquer, etc.
1. Recensement et enquête-échantillon
•Il y a deux genres d'enquête, enquête-échantillon et le recensement.

•La différence est que le recensement cible la collecte de renseignements pour toutes
les unités de la population, mais l'enquête-échantillon retient à cette fin une partie
seulement (habituellement très petite) des unités de la population.

• Dans les deux cas, l’information sert à établir des statistiques pour la population dans
l’ensemble et, habituellement, pour des sous-groupes de la population.
Pourquoi préférer l'enquête-échantillon au recensement?

•La principale raison est que l'enquête - échantillon est souvent un moyen plus économique
et rapide d’obtenir de l’information de qualité suffisante pour les besoins du client.

•Étant donné qu’une enquête-échantillon est une opération à plus petite échelle qu’un
recensement, elle est aussi plus facile à contrôler et à surveiller.

•Dans certains cas cependant, un recensement peut être préférable ou nécessaire.


Liste des éléments les plus importants à considérer
avant de choisir un recensement ou une enquête par échantillonnage :

i. Erreurs d'enquête
ii. Coût
iii. Rapidité d’exécution
iv. Taille de la population
vi. Prédominance des attributs
vii. Besoins spécialisés
viii. Autres éléments
i. Erreurs d'enquête
• Il y a 2 genres d’erreurs d'enquête: l’erreur d’échantillonnage et l’erreur non
due à l’échantillonnage.

•L’erreur d’échantillonnage est propre à toute enquête-échantillon.

•Il y a erreur d’échantillonnage lorsqu’on estime une caractéristique en


mesurant seulement une partie de la population au lieu de la population au
complet.
•L’erreur d’échantillonnage est habituellement mesurée en déterminant dans
quelle mesure les estimations de l’échantillon sont différentes l’une de
l’autre, compte tenu de tous les échantillons possibles de la même taille et
en appliquant la même méthode d’échantillonnage

• On doit décider au début de l'enquête avant de déterminer la taille de


l'échantillon quelle valeur d'erreur on est prêt à accepter
Erreurs non dues à l’échantillonnage

•Toute enquête peut cependant comporter des erreurs non dues à l’échantillonnage,
càd. toutes les erreurs qui ne sont pas liées à l’échantillonnage

• Ces erreurs peuvent donner des résultats d'enquête biaisés

• Les erreurs de mesure et de traitement sont des exemples d’erreurs non dues à
l’échantillonnage.
ii. Coût
• Étant donné que tous les membres de la population font l’objet de l'enquête, le
recensement coute plus cher que l'enquête-échantillon (la collecte des données est l’activité la
plus chère de l'enquête).

• Dans le cas d’une grande population, il est habituellement possible d’obtenir des résultats
précis à partir d’échantillons relativement modestes.

• Un recensement couterait considérablement plus cher.


iii. Rapidité d’exécution
•Il faut: (1) obtenir et traiter les données,
•(2) diffuser les résultats, au cours d’une période relativement brève.

•Le recensement saisit des données pour toute la population

La collecte et le traitement des données d’un recensement


demandent considérablement plus de temps que pour une enquête-
échantillon.
iv. Taille de la population
•Le recensement peut être préférable pour une petite population.
•Pour faire des estimations ayant une petite erreur d’échantillonnage, il peut être nécessaire
de tirer un large échantillon de la population.

•Dans ce cas et pour des frais supplémentaires minimes, les données peuvent être
disponibles pour toute la population, au lieu d’une fraction seulement.

•Le recensement d’une grande population d’autre part coûte très cher et L'enquête-
échantillon est donc habituellement préférable.
v. Estimation pour un petit domaine
•Le recensement peut être préférable lorsque des estimations d'enquête sont nécessaires pour des
secteurs géographiques restreints ou des secteurs ayant une petite population.

•Il est parfois possible de combiner les deux.


•Étant donné que le recensement cible chacun et qu’il n’y a pas d’erreur d’échantillonnage, il
peut donner des estimations pour tous les sous-groupes possibles de la population.

•Si une enquête nationale est nécessaire, par exemple, pour obtenir des statistiques sur chaque
ville au pays et vous voulez des estimations sur de petits domaines, par exemple, l'enquête-
échantillon peut se dérouler dans les plus grandes villes et le recensement, dans les plus petites.
vi. Prédominance des attributs
•Si l’objectif de l'enquête est d’estimer la proportion de la population ayant une certaine
caractéristique, et
• si la caractéristique est commune, une enquête-échantillon devrait être suffisante.
•Si la caractéristique est rare, le recensement peut être nécessaire.

La taille de la sous-population ayant la caractéristique détermine le choix.


Exemple
•le client veut déterminer le pourcentage de personnes âgées dans la population et que ce
pourcentage, à son avis, est d’environ 15 %.
•L'enquête-échantillon devrait permettre d’estimer ce pourcentage avec une petite erreur
d’échantillonnage.

•Si les attributs sont plus rares cependant, et s’ils touchent moins de 1 % de la population, le
recensement peut être plus approprié.

•Il est bien entendu possible qu’avant de procéder à l'enquête, absolument personne n’ait de
donnée sur la prédominance de l’attribut en question
procéder à une étude préliminaire, càd. une étude de faisabilité ou une enquête pilote
viii. Autres éléments

•Il y a d’autres raisons de faire le recensement:


1. La création d’une base de sondage:
•De nombreux pays, par exemple, font le recensement décennal de la population.
•Les données tirées de ce genre de recensement peuvent servir de base de sondage à une
enquête-échantillon ultérieure qui cible la même population

2. Obtenir de l’information comparative:


•L’information comparative peut être le dénombrement connu de la population, par exemple, le
nombre d’hommes et de femmes
vii. Besoins spécialisés
•Il arrive que l’information voulue par enquête ne peut être demandée directement au
répondant ou elle peut être un fardeau pour lui.
•Une enquête sur la santé, par exemple, peut demander des données sur la tension artérielle, le
groupe sanguin et la condition physique des répondants, données qui peuvent être déterminées
avec précision par un professionnel de la santé seulement.

•Si le genre de données visées demande du personnel chevronné, du matériel de mesure qui
coûte cher, ou s’il faut imposer un fardeau relativement lourd aux répondants, il peut être
impossible de faire un recensement.

• Dans certains domaines en particulier (contrôle qualitatif d’un processus de fabrication par
exemple), le caractère destructif de certains tests peut indiquer que l'enquête-échantillon est
la seule option logique.
2. Population cible et population d'enquête

•Les éléments suivants sont essentiels à la définition de la population cible et aux


définitions opérationnelles en général :
•genre d’unités que comprend la population et caractéristiques particulières de ces unités
(qui ou quoi?),
•localisation des unités (où?),
•période de référence considérée (quand?).

• L’organisme statistique commence avec une population conceptuelle, pour


laquelle il n’y a peut-être aucune liste concrète, afin de définir la population
cible.
Population d'enquête
•La population d'enquête est en fait la population que couvre l'enquête.

Exemple: Enquête sur les revenus et les dépenses des ménages


•Population cible : Toute la population résidant au Canada le 30 avril 1997.
•Population d'enquête : La population du Canada au 30 avril 1997, à l’exception de ceux qui
habitent dans des institutions ou qui n’ont aucune adresse permanente.

•Elle peut être différente de la population cible, mais idéalement, les deux devraient être très
semblables.
• Il est important de souligner que les conclusions tirées des résultats de l'enquête s’appliquent
seulement à la population de l'enquête.
Pourquoi les deux populations se diffèrent?

• La difficulté et le cout élevé de la collecte des données dans les régions isolées, par
exemple, peut motiver la décision d’exclure ces unités de la population d'enquête.

• De même, les membres de la population cible qui vivent à l’étranger ou qui sont dans
des institutions peuvent être exclus de la population d'enquête s’il est trop difficile ou
coûteux de les intégrer
3. Base de sondage
•Lorsque la définition de la population cible satisfait le client et l’organisme statistique,
certains moyens accès aux unités de la population sont nécessaires.

•La base de sondage donne les moyens d’identifier les unités de la population d'enquête et
de communiquer avec elles.

• Cette base de sondage définit en bout de ligne la population d'enquête : si la base de


sondage ne comprend pas les numéros de téléphone non publiés, par exemple, ils sont aussi
exclus de la population d'enquête.
•La population cible est souvent redéfinie pour correspondre à la population qui peut en
pratique faire l’objet d’une enquête.

•On considère dans ce cours que la population cible fait référence à la population que l'enquête
prévoit couvrir, compte tenu des contraintes opérationnelles et pratiques et de la base de
sondage utilisée.

•Une base de sondage est nécessaire, non seulement comme véhicule d’accès aux unités de la
population d'enquête, mais aussi parce que dans certaines enquêtes, l’organisme statistique doit
être en mesure de calculer la probabilité d’inclusion que présente une unité de la population
dans l’échantillon.

•Si on a recours à l’échantillonnage probabiliste, ces probabilités permettent de tirer des


conclusions sur la population observée, et c’est l’objectif de l'enquête. (Chapitre 6)
•Dans certaines enquêtes, ces unités sont toutes les mêmes, mais il en est souvent
autrement.

• La base de sondage devrait comprendre les renseignements suivants, en tout ou en


partie :
i. Données d’identification
ii. Données de communication
iii. Données de classification
iv. Données de mise à jour
v. Données de couplage
i. Données d’identification /ii. de communication

i. Ce sont les renseignements de la base de sondage qui identifient sans ambiguïté


Chaque unité de l’échantillon, par exemple, le nom, l’adresse exacte et un numéro
d’identification unique

ii. Ce sont les renseignements nécessaires pour situer les unités de l’échantillon
pendant la collecte, par exemple, l’adresse postale ou le numéro de téléphone
iii. Données de classification
•Les données de classification servent à la sélection de l’échantillon et, éventuellement, à
l’estimation.

•Si les gens qui habitent dans des appartements, par exemple, font l’objet d’une enquête
différente de ceux qui habitent dans des résidences, la base de sondage doit donc classer
différents types de logement (càd. appartements, maisons individuelles, etc.).

•Les données de classification peuvent aussi comprendre une mesure de la taille à utiliser
pour l’échantillonnage, par exemple, le nombre d’employés qui travaillent dans une
entreprise ou le nombre d’acres d’une ferme.
iv. Données de mise à jour\ v. Données de couplage

iv. Les données de mise à jour sont nécessaires si l'enquête doit être réitérée, par
exemple, dates des ajouts ou des modifications apportées aux données de la base de
sondage.

v. Les données de couplage sont utilisées pour lier les unités de la base de sondage à une
source de données plus à jour, par exemple, pour mettre à jour la base de sondage.
En résumé
•La base de sondage est un ensemble de renseignements qui donnent le moyen d’avoir accès
aux unités sélectionnées de la population de l'enquête.

•Les données d’identification et de communication sont le minimum nécessaire pour faire


l'enquête.

•Les données de classification, de mise à jour et de couplage sont cependant aussi


souhaitables.

•Les données de la base de sondage sont un outil d’échantillonnage, mais nous constaterons
aussi dans les chapitres ultérieurs qu’elles peuvent servir à vérifier et imputer des données
manquantes ou incohérentes, et à améliorer l’échantillonnage et l’estimation.
3.1 Types de base de sondage

•Il y a deux principales catégories de base de sondage : les listes et les bases aréolaires.
Si aucune base de sondage n’est appropriée, des bases multiples peuvent être utilisées.
•Liste :
Une liste peut être définie comme une liste conceptuelle ou physique de toutes les
unités de la population de l'enquête.
•Une liste conceptuelle est souvent utilisée pour une population qui existe seulement au
cours de l'enquête.
•Il est possible d’obtenir des listes physiques, ou listes réelles des unités de la population,
de différentes sources.
•Divers organismes et paliers de l’administration publique maintiennent des listes à des
fins administratives.
• Voici des exemples de liste :
•registre des statistiques de l’état civil (p. ex., une liste de toutes les naissances ou de tous les décès
dans la population, ou les deux),
•registre des entreprises (p. ex., une liste de toutes les entreprises en exploitation),
•registre des adresses (p. ex., une liste des ménages et des adresses municipales),
•annuaire téléphonique (càd. une liste de tous les ménages dont le numéro de téléphone est publié),
•listes de clients (càd. une liste de tous les clients d’une entreprise),
•listes de membres (c.àd. une liste de tous les membres d’un organisme).
Il faut tenir compte des éléments suivants lorsqu’on utilise des données
administratives pour établir une liste :

i. Coût, ii. Couverture, iii. Mise à jour, iv. Définitions, v. Qualité,


vi. Stabilité de l’information de la source, vii. Relations officielles et juridiques, viii.
Documentation, ix. Accessibilité – facilité d’utilisation
Base aréolaire
•C'est une liste spéciale dont les unités sont des secteurs géographiques.

•La population observée est située dans ces secteurs géographiques. Les bases aréolaires
peuvent servir lorsque l'enquête a un caractère géographique (mesurer les peuplements de la
faune, par exemple, en comptant le nombre d’animaux par kilomètre carré) ou lorsqu’une liste
appropriée n’est pas disponible, auquel cas la base aréolaire peut être un moyen de créer une
liste.

• Une liste inappropriée est souvent un problème:C’est parce que les populations peuvent
changer avec le temps, des unités naissent, meurent, déménagent ou changent de nom, de
composition ou de caractère, et n’importe quelle liste peut devenir désuète.
•L’échantillonnage à partir d’une base aréolaire est souvent effectué en plusieurs étapes.
•Supposons, par exemple, qu’il faut tirer un échantillon des logements d’une ville en
particulier pour l'enquête, mais qu’il n’y a pas de liste à jour.

•Une base aréolaire peut servir à créer une liste à jour des logements, comme suit :

•À la première étape de l’échantillonnage, des secteurs géographiques sont échantillonnés,


par exemple, les ilots d’une ville.

•Ensuite, pour chaque ilot sélectionné, une liste est établie en énumérant tous les logements
des ilots échantillonnés en ville.
3 Base de sondage multiple
•Une base de sondage multiple est une combinaison de deux bases ou plus (des listes
et des bases aréolaires ou deux listes ou plus).

•Les bases de sondage multiples sont habituellement utilisées lorsqu’aucune base unique
ne peut fournir la couverture nécessaire de la population cible.

• Pendant l'Enquête sur la santé dans les collectivités canadiennes (ESCC), on utilise la
base aréolaire de L'Enquête sur la population active (EPA) et une base de composition
aléatoire (CA).
2 Défauts de la base de sondage

• Plusieurs défauts de base éventuels sont décrits ci-dessous :


• Sous-dénombrement
•Sur-dénombrement
•répétition
•Classification erronée
3 Qualités d’une bonne base de sondage

Quatre critères déterminent la qualité d’une base de sondage :


i. Pertinence
ii. Précision
iii. Actualité/ Fraîcheur
iv. Coût
•Les limites géographiques sont cependant plus stables et il est souvent plus facile de
maintenir une base aréolaire.

•Les bases aréolaires sont habituellement composées d’une hiérarchie d’unités géographiques.

•Des unités de base de sondage à un niveau peuvent être subdivisées pour former des unités
au niveau suivant.

• Les grandes régions géographiques comme les provinces peuvent être composées de
districts ou de municipalités qui peuvent aussi être divisés en plus petits secteurs, par
exemples, les ilots d’une ville.

•Dans les plus petits secteurs géographiques échantillonnés, la population peut être listée pour
échantillonner les unités de ce secteur.

Vous aimerez peut-être aussi