Vous êtes sur la page 1sur 8

L’ECHANTILLONNAGE

Questionnaire (quantitatif)
1 Outils d’enquête
Entretien (Qualitative)

Recensement (Etude de la Population)

2 Types d’enquête échantillon


probabiliste
Sondage (Etude d’un échantillonnage)

Echantillon non
probabiliste

Echantillonnage Probabiliste Echantillonnage non Probabiliste

- Population connu - Population non connu


- Données de sources secondaires - Données de sources primaires
Caractéristique - Les unités statistiques ont la même - Choix arbitraire des unités statistique
chance d’être sélectionnée (l’enquêteur sélectionne de son grée les
- On fait recours à la randomisation unités devant faire partir de son échantillon
et non et le hasard)

- Echantillonnage aléatoire simple - Echantillonnage par commodité


- Echantillonnage systématique - Echantillonnage volontaire
- Echantillonnage avec probabilité - Echantillonnage au jugé
Procédure proportionnel à la taille - Echantillonnage par quotas
- Echantillonnage stratifié
- Echantillonnage en grappe ou par
grappe
- Echantillonnage à plusieurs phases

-
Exemple 1 : étude portant sur l’ensemble des clients d’une marque quelconque répertoriés au sein d’une entreprise.

(Dans cet exemple il s’agit de l’échantillonnage probabiliste car la population est connue et les données sont de source
secondaire)

Exemple 2 : Etude portant sur les consommateurs gabonais du prêt à porter. (Quand à cet exemple il s’agit d’un échantillonnage
non probabiliste
Lescarprincipales
la population est non connu
techniques de plus nous sommes
d’échantillonnage non obligés de trouver
probabiliste : nous-mêmes des données primaire)

Emmanuel Le Roi NSO FILS - « L’Echantillonnage » - (+241) 062 23 15 42 Page 1


L’échantillonnage par commodité encore appelé échantillonnage à l’aveuglette ou
accidentelle.
L’on sélectionne de manière arbitraire les individus dont on a facilement accès.

Exemple :
- Les reporteurs d’une chaine de télévision souvent à la recherche de l’interview des
gens de la rue
- Les femmes qui au début s’assoient à la première rangée
- Les trois premières personnes qui téléphonent à une station de radio dans le cadre d’un
qu’elle a organisé

La principale limite de cette technique d’échantillonnage est qu’elle nous donne


généralement un échantillon non représentatif

L’échantillonnage volontaire ou de convenance


Ici, les enquêtés offrent volontairement leurs services pour une étude

Exemple :
Les sondages par ligne du clip de la semaine.

La principale limite de cette technique d’échantillonnage est qu’elle nous donne


généralement un échantillon non représentatif

L’échantillonnage au jugé ou par choix raisonné


Ici l’enquêteur prélève son échantillon tenant compte de ces préjugées

La principale limite de cette technique d’échantillonnage est qu’elle nous donne


généralement un échantillon non représentatif

L’échantillonnage par la méthode des quotas

Emmanuel Le Roi NSO FILS - « L’Echantillonnage » - (+241) 062 23 15 42 Page 2


Exemple 1 :

PERSONNEL DE LA DCRH DU MEF

Directions & Services Effectif Pourcentage Quota du personnel à


(%) l’intérieur de l’échantillon de
20

Direction Centrale 12 30,77% 05

Gestion des RH 04 10,26% 02

Formation et parcours professionnel 05 12,82% 03

Politique sociale et condition de travail 05 12,82% 03

Actes de gestion 08 20,51% 04

Archives et documentation 05 12,82% 03

Total 39 100% 20

30,77% des membres de la population de la DCRH du MEF font partie de la Direction


Centrale, l'échantillon devrait être constitué dans une proportion de 30,77% de l’effectif, soit :

 (30,77% de 100) * 20 = 0,3077 x 20= 05


 (10,26%de 100) * 20 = 0,1026 x 20= 02
 (12,82%de 100) * 20 = 0,1282 x 20= 03
 (12,82%de 100) * 20 = 0,1282 x 20= 03
 (20,51%de 100) * 20 = 0,2051 x 20= 04
 (12,82%de 100) * 20 = 0,1282 x 20= 03

Exemple 2 :
Etude du comportement des achats prêt-à-porter pour quatre groupes homogènes (hommes,
femmes, enfants, bébés).

La proportion d’achat de chaque segment concerne 40% de femmes, 20% d’hommes, 20%
d’enfants et 20% de bébés.
Calculer le quota de chaque segment à l’intérieur d’un échantillon de 600.
Sol :

40% des achats prêt-à-porter sont effectués par les femmes. Soit (40% de 100)*600 = 0,4*600
= 240 femmes.

Emmanuel Le Roi NSO FILS - « L’Echantillonnage » - (+241) 062 23 15 42 Page 3


20% des achats prêt-à-porter sont effectués par les hommes. Soit (20% de 100)*600 =
0,2*600 = 120 hommes.

Remarque : Le nombre de personnes à intérroger

1. Le nombre de personnes à interroger

Cette question est une question récurrente à laquelle une réponse


fréquente est donnée : ça dépend !

Cas 1 : Echantillonnage non Probabiliste

De manière conventionnelle, pour une population de taille , on devrait avoir la taille


de l’échantillon .
Cas 2 : Echantillonnage Probabiliste

Différents éléments doivent être examinés. Tout d’abord du point de


vue statistique, le choix de la taille de l’échantillon dépendra de la précision
que l’on veut atteindre dans les conditions les moins favorables. Cet aspect
renvoie en fait à la précision du sondage et au calcul de l’intervalle de
confiance. Il n’y a pas de certitude dans la question de l’échantillonnage,
mais avec une méthode probabiliste, on peut calculer la précision des
observations grâce à un intervalle de confiance dans lequel la véritable
valeur, si on interrogeait la population complète, devrait se trouver. Pour
calculer cet intervalle de confiance, par exemple pour un échantillon de 100
individus, si on prend « p » le pourcentage de personnes observées dans
l’échantillon et « n » la taille de l’échantillon, l’erreur d’échantillonnage1 « E »
s’estime avec le calcul :

√ ⁄

Ce calcul permet de présenter les résultats de la façon suivante


(présentation qui est rarement respectée) : « il y a 95% de chances sur 100
pour que le pourcentage de « oui » dans la population soit compris entre 47%

1 Lorsque vous menez une enquête échantillon, celle-ci sera sujette à ce que l’on appelle en statistique l’erreur
d’échantillonnage. Elle se produit lorsqu’on estime une caractéristique de la population en étudiant seulement une
partie de la population au lieu de la population au complet.

Emmanuel Le Roi NSO FILS - « L’Echantillonnage » - (+241) 062 23 15 42 Page 4


et 53% ». Les valeurs limites de l’intervalle de confiance sont fonction du
choix du seuil de confiance, c'est-à-dire le risque que l’on décide de prendre
(il peut être de 0.1%, 1%, 5%, 10%...). Si on prend l’exemple pour un risque
de 5% (ce qui signifie, j’ai 5% de risque de me tromper), on obtient une
présentation des résultats sous la forme : il y a 95% de chances que le
pourcentage soit dans l’intervalle : p± 1.96 .
Cet intervalle de confiance évolue selon la taille de l’échantillon. Si on
a une question où 50% des réponses sont positives, dans 95% des cas, la
valeur connue sera :

± 10% si on interroge 100 personnes

± 5% si on interroge 400 personnes

± 1% si on interroge 10 000 personnes

Plus la taille de l’échantillon augmente, plus l’erreur d’échantillonnage


diminue. Donc quand on augmente la taille de l’échantillon, on améliore la
précision, mais le coût de l’enquête augmente également. Il faut alors trouver
un équilibre entre faisabilité et précision.

Un second élément à considérer est l’existence de sous-groupes. Si l’on


souhaite obtenir des résultats pour des sous-groupes et pas uniquement des
résultats globaux, par exemple par catégories d’âge ou par catégories
socioprofessionnelles… il faut alors considérer l’effectif du sous-groupe et
non l’effectif global. La précision sera alors liée à l’effectif du sous-groupe.
Par exemple si on souhaite obtenir un groupe de 500 élèves en école
élémentaire dyslexiques pour analyser plus finement leurs compétences, et
qu’on estime à 5% l’apparition de ce caractère, il faudra interroger un
échantillon de taille n= 500 x (100/5) = 10000 élèves en école élémentaire.

Il faut par ailleurs tenir compte d’un ensemble de critères comme la


méthode d’échantillonnage sélectionnée, les moyens matériels : budget,
temps, moyens humains.

Emmanuel Le Roi NSO FILS - « L’Echantillonnage » - (+241) 062 23 15 42 Page 5


Encadré : Taille optimale de l’échantillon
Il existe deux catégories d’échantillonnage : L’échantillonnage probabiliste et
l’échantillonnage non probabiliste. L’échantillonnage probabiliste repose sur le fait que la
population soit connue tandis que l’échantillonnage non probabiliste encore appelé
échantillonnage expérimental ne repose pas sur la maîtrise de la taille de la population.
Ainsi, on peut en déduire que la question de la représentativité de l’échantillon soit une
préoccupation majeure pour l’échantillonnage probabiliste et non celle de l’échantillonnage
expérimental. A cet effet, la formule de Lorentz est utilisée pour déterminer la taille optimale
de l’échantillon nécessaire pour représenter une population connue.


 P représente la probabilité que l’évènement principal étudié se réalise.
Exemple : Un groupe de recherche mène une étude sur les déterminants de l’accès aux
hôpitaux publics. Il faut rappeler au passage que lorsqu’un patient est malade en Afrique, il
peut se faire soigner dans un hôpital public, un hôpital privé, à l’église ou à la Mosquée et
chez le naturopathe. Si sur 100 malades, 25 décident de se soigner dans un hôpital public,
alors P= 25/100 = 0,25 = 25%. Techniquement, s’il existe les chiffres officiels au niveau
national ou au niveau provincial, alors il faudrait les considérer. Par exemple, si le
gouvernement Gabonais à travers le ministère de la santé publie un rapport démontrant
que 30% des citoyens font recours aux hôpitaux publics lorsqu’ils sont malades, le
chercheur va tout simplement considérer que P = 0,3. Par contre, si la problématique
étudiée n’a fait encore l’objet d’une étude officielle (gouvernement, ONG, Société Civile), le
chercheur n’a pas de référence officielle. Dans ce cas, il doit faire recourt à un spécialiste du
domaine à l’effet de trouver la valeur de P. Par exemple, le chercheur analyse les
déterminants de l’invalidité des personnes victimes de l’accident de la voie publique. P
représente ici la probabilité qu’une personne victime d’un accident de la voie publique soit
invalide. En absence de statistiques à l’échelle nationale, le chercheur peut faire recourt à
un spécialiste de la voie publique pour avoir une idée de l’estimation faite par ce dernier.
 : constitue la valeur critique à retrouver dans la table de la Loi normale. En réalité,
il représente l’erreur que le chercheur peut commettre lors du processus de calcul.
Nous sommes des humains et nous ne sommes pas parfait y compris les machines

Emmanuel Le Roi NSO FILS - « L’Echantillonnage » - (+241) 062 23 15 42 Page 6


industrielles (car, elles ne sont pas fiables à 100%). Prenons le cas de la SOBRAGA
qui fabrique des bières. Il peut arriver parfois que certaines bouteilles de bières soient
moins pleines par rapport à la normale. Cela signifie qu’il existe les défauts de
fabrications. Cette situation traduit des imperfections que l’on doit prendre en
compte. A cet effet, à chaque degré d’imperfection (niveau de signification),
correspond une valeur de .

En règle générale et de manière standard, le degré d’imperfection (niveau de signification)


est , ce qui correspond à .
 k représente la marge d’erreur. En effet, les réponses recueillies auprès des
répondants ne sont pas toujours juste. Par exemple, si vous menez une étude sur le
revenu ou les pratiques sexuelles des individus. Il faut savoir que les réponses
recueillies ne seront pas toujours juste. C’est pour cette raison que le chercheur se
doit définir de manière arbitraire la marge d’erreur qui correspond en quelque sorte
au taux de mauvaise réponse. Il est préférable que la marge d’erreur soit comprise
dans l’intervalle 0,01 .

Application :
On souhaite analyser l’effet de l’assiduité sur la performance académique des étudiants
dans un établissement Universitaire privé de Libreville.
La taille optimale de l’échantillon à interroger est la suivante :

 P représente la probabilité qu’un étudiant soit assidu.


En absence des statistiques à l’échelle nationale sur l’assiduité des étudiants, j’irai
interviewer le responsable des études à l’effet d’obtenir ce chiffre. S’il déclare que le taux
d’assiduité est de 85%. Je vais considérer P = 0,85.
 En règle générale et de manière standard, le degré d’imperfection (niveau de
signification) est , ce qui correspond à .

 En général, les réponses de tous les répondants ne sont pas toujours justes. A cet

Emmanuel Le Roi NSO FILS - « L’Echantillonnage » - (+241) 062 23 15 42 Page 7


effet, je considère de manière arbitraire une marge d’erreur de k= 7%.

Ainsi,

La taille optimale de l’échantillon est .


NB : S’il y a des possibilités d’interroger plus de 100 personnes dans cette étude, il faudrait
le faire pour deux raisons : d’abord parce que 100 ne constitue que le minimum et ensuite,
plus la taille de l’échantillon est grande, plus les résultats sont fiables. Si vous ne voulez
pas enquêtez plus de personnes, il faut augmenter la valeur de K, dans le cas contraire, il
faut plutôt la réduire.

Emmanuel Le Roi NSO FILS - « L’Echantillonnage » - (+241) 062 23 15 42 Page 8

Vous aimerez peut-être aussi