Académique Documents
Professionnel Documents
Culture Documents
Bonjour,
L’objectif de cette séance est de vous présenter les différents processus de sélection des
échantillons.
La définition proposée par le Larousse du terme échantillon est « ensemble représentatif d’une
« population-mère » possédant les mêmes caractéristiques ». Nous pouvons pour cela penser
aux échantillons géologiques, aux coupons de tissus, aux échantillons biologiques mais aussi
aux échantillons d’individus. Cependant, cette définition peut être comprise de manières bien
différentes, car que signifie finalement « posséder les mêmes caractéristiques » ? Ce qui est
important c’est d’obtenir un sous-ensemble permettant de prévoir les informations inconnues
de la population-source.
Lors d’un échantillonnage aléatoire, toute personne de la population source a une chance
d’être incluse dans l’échantillon. Par contre dans le cas d’un échantillonnage non aléatoire,
certaines personnes n’ont aucune chance d’être sélectionnées.
Parmi les sélections non aléatoires, nous pouvons tout d’abord parler de la sélection par
volontariat, cela signifie que les unités se sélectionnent elles-mêmes.
L’étude i-Share correspond tout à fait à une situation d’inclusion par volontariat. En effet,
une communication est réalisée pour indiquer qu’une grande étude sur la santé des
étudiants est lancée, et ce sont les étudiants qui doivent eux–mêmes prendre contact pour y
participer.
Ce type de sélection est éthique, puisqu’elle laisse la possibilité aux personnes le souhaitant
de participer ou non. Cependant, le problème est qu’il est difficile de mesurer la différence
pouvant exister entre les personnes volontaires et l’ensemble de la population source initiale :
est-ce que les personnes volontaires pour participer à une enquête auront le même type de
réponse que le reste de la population ? Il est impossible de répondre à cette question de
manière générale, car la réponse dépendra certainement du sujet de l’enquête et aussi de la
manière de solliciter les personnes pour y participer.
Une autre méthode non aléatoire est la méthode des quotas, qui consiste à construire un
échantillon comme un modèle réduit de la population selon certaines caractéristiques. Elle est
très utilisée car elle est plus rapide et moins couteuse que les méthodes aléatoires présentées
dans la suite. Malheureusement, elle est souvent moins fiable. Mais de quoi s’agit-il
MOOC PoP-HealtH 1
exactement ? Supposons que notre population soit composée de trois profils, il y a 30% des
personnes avec des loupes bleues, 20% avec des loupes vertes et 50% avec des loupes jaunes.
Le constructeur de l’échantillon choisit de manière arbitraire 10 personnes en conservant la
même répartition. Il prend donc 3 personnes ayant une loupe bleue, car cela correspond à 30%
de 10, puis 2 personnes ayant une loupe verte et enfin 5 personnes ayant une loupe jaune. Le
choix peut donc être laissé au bon vouloir de l’enquêteur dès lors qu’il respecte dans son
échantillon la répartition connue de la population.
Nous vous proposons comme exemple « le Baromètre de l’équité en santé 2016 », enquête
réalisée par l’Institut BVA, institut d’études de marché et d’opinion. Cette enquête avait
pour objectif la connaissance des français quant à la problématique de la sédentarité et du
manque d’activité physique. Pour cette enquête, 1 007 personnes ont été enquêtées, selon
la méthode des quotas, selon le sexe, l’âge, la profession de l’interviewé, la région de
résidence et la catégorie d’agglomération. Cela signifie donc que, pour chacune de ces
informations, l’échantillon avait la même répartition que la population française des plus
de 18 ans.
Nous allons maintenant nous attarder sur les procédures de sélection aléatoire qui sont, si
possible, à privilégier dans les enquêtes pour ne pas induire des biais de sélection et laisser le
hasard faire les choses.
MOOC PoP-HealtH 2
sera réalisé. La réunion des 4 échantillons constituera ainsi l’échantillon final. La procédure
d’échantillonnage stratifiée permet d’assurer la présence des différents profils selon la
caractéristique choisie, et ainsi d’assurer une meilleure représentativité de la population
source sur cette caractéristique.
Comme nous venons de le voir, la stratification lors de l’échantillonnage a beaucoup d’attraits
pour améliorer le sondage. Cependant sa mise en œuvre peut compliquer la sélection, voire la
rendre impossible.
La sélection aléatoire en grappes est, quant à elle, souvent utilisée pour simplifier la mise en
œuvre de l’enquête. Dans certaines situations, il est en effet impossible de sélectionner
directement les unités statistiques, et il est nécessaire de sélectionner des groupes d’unités
statistiques, qui sont appelés grappes.
Reprenons l’exemple de la santé bucco-dentaire chez les élèves d’écoles primaires du
département d’Eure-et-Loir, les deux méthodes précédentes peuvent nécessiter de
nombreux déplacements au sein du département en raison de la dispersion géographique
des écoles dans ce département. Pour éviter cela, on souhaite concentrer l’enquête sur
certaines écoles. Chaque élève appartient à une et une seule école primaire. Faire un
sondage en grappes pour cette enquête consiste à tirer au sort un échantillon d’école dans
la liste des écoles d’Eure-et-Loir, puis à enquêter auprès de tous les élèves des écoles
sélectionnées. On dira alors qu’une école est une grappe d’élèves.
En résumé, il y a deux grandes familles de sélection : non aléatoire et aléatoire. Parmi les
sélections non aléatoires, nous pouvons retenir l’échantillon de volontaires et la méthode des
quotas. Parmi les sélections aléatoires, nous pouvons retenir la sélection aléatoire simple, la
sélection stratifiée et la sélection en grappes.
Nous terminons donc cette présentation succincte des différents modes de sélection.
MOOC PoP-HealtH 3