Académique Documents
Professionnel Documents
Culture Documents
Chapitre 4 - ECHANTILLONAGE
Chapitre 4 - ECHANTILLONAGE
CONCEPTION DU QUESTIONNAIRE
Partie 1 / Echantillonnage
BENSGHIR AFAF
Si la décision est une enquête par échantillon, on doit donc prévoir comment on
va sélectionner notre échantillon, c’est ce qu’on appelle : échantillonnage.
1. L’échantillonnage.
A/ Soit par tirage systématique : cette méthode très simple ne peut être utilisée
que si les unités de la liste sont classées de manière aléatoire. C’est une méthode
de sélection en une étape qui garantit que chaque échantillon possible de taille n
a une chance égale d’être sélectionné. Chaque unité de l’échantillon a donc la
même probabilité d’inclusion. Cette probabilité, π, est égale à n/N, où N est le
nombre d’unités dans la population étudiée.
• Exemple : si N taille de la population est égale à 1000, si n taille de
l’échantillon souhaitée, le taux de sondage n/N est égale à 100/1000 soit
1/10, on procède de la façon suivante : on tire d’abord au hasard la
première unité comprise entre la première et la deuxième place (hypothèse
3) on sélectionne ensuite les unités à interroger qui sont dans ce cas les 3e,
13e,23e,… jusqu’à arriver à 100unités.
Ce type de sondage est souvent utilisé lorsque la population mère est divisible
en groupe homogène (appelé strate), dans chaque strate définie préalablement
on réalise un sondage aléatoire. L’addition de ses sous échantillons va constituer
l’échantillon total.
Trois principales raisons justifient la stratification. Premièrement, elle permet
d’obtenir une stratégie d’échantillonnage plus efficiente que celle de l’EAS ou
du SYS. Deuxièmement, elle donne des tailles d’échantillon suffisantes pour des
domaines d’intérêt en particulier qui motivent l’analyse à effectuer.
Troisièmement, elle aide à éviter de tirer un « mauvais » échantillon.
Il faut observer une forte homogénéité dans une strate (c.-à-d. que les unités
d’une strate devraient être semblables quant à la variable d’intérêt) pour
améliorer l’efficience statistique d’une stratégie d’échantillonnage de l’EAS et
les strates elles-mêmes doivent être différentes le plus possible (quant à la même
variable d’intérêt). On peut généralement obtenir ce résultat si les variables de la
stratification sont corrélées avec la variable d’intérêt de l’enquête.
Nos considérations ont été axées jusqu’à maintenant sur les plans
d’échantillonnage à un degré. L’échantillonnage à plusieurs degrés est le
processus de sélection d’un échantillon à deux degrés successifs ou plus. Les
unités sélectionnées au premier degré sont intitulées unités primaires
d’échantillonnage (UPÉ), les unités sélectionnées au deuxième degré sont
intitulées unités secondaires d’échantillonnage (USÉ), etc. Les unités à chaque
degré ont une structure différente et sont hiérarchiques.
Les échantillons à plusieurs degrés peuvent avoir n’importe quel nombre de
degrés, mais, étant donné que la complexité du plan (et de l’estimation)
augmente avec le nombre de degrés, les plans d’échantillonnage sont souvent
restreints à deux ou trois degrés.
Pour cette méthode, au lieu de tirer au sort par exemple 500 entreprises dans une
population de 25000, on regroupera ces entreprises par départements, et on tirera
au sort un certain nombre de départements, puis dans chacun des départements,
on effectuera un nouveau tirage au sort dans la liste des entreprises de ces
départements.
Donc, contrairement aux méthodes probabilistes qui utilisent des listes dans
lesquelles on prélève aléatoirement des unités d’échantillon, les méthodes non
probabilistes sont empiriques ou raisonnées.
Par exemple, il est courant que l’intervieweur décide subjectivement qui doit
être échantillonné. Étant donné que l’intervieweur sélectionnera probablement
les membres de la population les plus amicaux ou faciles d’accès, une partie
importante de la population n’aura aucune chance d’être sélectionnée et celle-ci
sera peut-être systématiquement différente des membres sélectionnés. Non
seulement la situation peut biaiser les résultats de l’enquête, mais elle peut aussi
diminuer erronément la variabilité apparente de la population à cause d’une
tendance à sélectionner des unités « typiques » et d’éliminer les valeurs
extrêmes. L’échantillonnage probabiliste évite justement ce genre de biais à
cause de la sélection aléatoire des unités.
Cette méthode fait appel à des répondants volontaires. Les volontaires doivent
généralement faire l’objet d’un examen pour obtenir un ensemble de
caractéristiques qui convient aux objectifs de l’enquête ; Cette méthode peut être
marquée d’un important biais de sélection, mais elle est parfois nécessaire. Pour
des raisons de déontologie, on peut faire appel, par exemple, à des volontaires
ayant des conditions médicales particulières pour procéder à certaines
expériences médicales.
Dans ce cas les enquêteurs se voient imposés un itinéraire très précis sur lequel
ils vont constituer leurs échantillons. Cette méthode permet d’éviter qu’ils
choisissent les unités assemblées d’une façon subjective et élimine en principe
ce risque de biais (ce risque d’erreur), exemple d’itinéraire, pour la rue x,
interroger tous les quatre numéros d’habitation (1, 4, 8, 12,…), les personnes
habitants le 2ème étage si absente ou inexistante passé au numéro suivant. Pour le
super marché ACIMA, interroger une personne tout les quatre à la caisse 5 de
10h à midi, une personne toute les quatre à 14h à la caisse 8.
La méthode des quotas suppose que l’échantillon doit avoir la même structure,
soit les mêmes caractéristiques que la population mère.
La méthode des quotas consiste donc à :
Tout d’abord, à définir une stratification dans la population de base au
moyen de critères près déterminés qui constituent à priori des facteurs
explicatifs de son comportement (âge, sexe, type d’habitat…) ;
Ensuite, à appliquer cette stratification à l’échantillon que devront sonder
les enquêteurs ;
Enfin, à procéder à un prélèvement non aléatoire des unités de
l’échantillon.
Exemple : dans le cas d’une population de base que l’on veut sonder, on
considère que le sexe, l’âge et la catégorie socioprofessionnelle sont les
critères déterminants, d’après les statistiques fiable cette population de base à
la structure suivante :
Sexe : 40 % hommes, 60 % femmes ;
Tranches d’âge :
A : 18 – 34 30 %
B : 35 – 44 30 %
C : 45 – 65 26 %
D : 65 et plus 14 %
Catégorie socioprofessionnelle :
Agriculteur : 4 %
Artisan, commerçant, chef d’entreprise : 6 %
Cadre et profession intellectuelle supérieur : 8 %
Profession intermédiaire : 18 %
Employé : 24 %
Ouvrier : 30 %
Retraité : 6 %
Autre actif : 4 %
Si la taille de l’échantillon est fixée à 1000 personnes, le plan de sondage
sera le suivant :