Académique Documents
Professionnel Documents
Culture Documents
2
Introduction :
Lorsque l’on souhaite produire des estimations sur une population, l’échantillonnage permet de
réduire le volume de données à traiter. Utilisé dans les enquêtes, il permet de sélectionner aléatoirement
un échantillon d’unités dans une base de sondage, unités qui seront ensuite enquêtée pour inférer sur la
population d’étude, la méthode d’échantillonnage utilisé est généralement un compromis entre la
recherche d’estimation précise et la nécessité de respecter un budget imposé.
Pour des études marketing (grand public), il est pratiquement impossible d’étudier tous les individus
d’une population pour des raisons de cout, de délai et de possibilité méthodologique.
C’est pour ces raisons là qu’on a souvent tendance à opter pour la deuxième solution, qui suppose
d’effectuer ce qu’on appelle un échantillonnage.
Il s’agit ensuite dans la seconde partie, Le choix de démarche d’échantillonnage : Démarches génériques
et démarches non génériques ou particulières.
Dans la troisième partie, il s’agit des critères pour composer un échantillon on a donc recours à des
techniques bien précises pour construire un échantillon et s’assurer qu’il est représentatif de sa
population mère. Il existe deux catégories de méthodes : les méthodes d’échantillonnage non
probabilistes ou empiriques et les méthodes d’échantillonnage probabiliste ou aléatoire.
Finalement nous allons traiter la détermination de la taille de l’échantillon qui dépend essentiellement de
deux facteurs la précision souhaitée et le budget disponible. Pus on souhaite des résultats précis, plus
l’échantillon nécessaire est important et plus on augmente la taille de l’échantillon, plus le coût de
l’enquête s’accroit.
3
I. Echantillon notion de base et représentativité :
Déf1 : Dans le cadre d’une étude quantitative par sondage, l’échantillonnage est la phase qui consiste à
sélectionner les individus que l’on souhaite interroger au sein de la population de base.
Les résultats obtenus sur l’échantillon sont ensuite extrapolés à la population que l’on souhaite étudier.
Déf2: Echantillonnage La sélection d’une partie dans un tout (la sélection d’une partie dans la
population), l’échantillon sélectionné doit être représentatif de la population.
Déf3 : L’échantillonnage est le procédé utilisé pour choisir un échantillon et qui est à la base de l'enquête
par sondage.
Déf4: l’échantillonnage est la phase qui consiste à sélectionner les individus que l’on souhaite interroger
au sein de la population de base.
Déf5 :L’échantillonnage a pour but d’extrapoler les résultats obtenus sur une petite partie à la population
parente.
-Il permet de former des conclusions au sujet d’un tout en y examinant une partie et de présumer les
caractéristiques d’une population après avoir observé une partie de l’ensemble de cette dernière.
4
L’échantillonnage comprendra donc toujours trois questions clés : quelle est la population ; quel
est échantillon qui la représente et comment choisir cet échantillon.
Ce processus nécessite donc d’étudier trois éléments essentiels: la population mère, la base de
sondage et l’échantillon.
La population mère : Dans le cadre d’une enquête par sondage la population mère est constituée
de la population sur laquelle porte l’étude et au sein de laquelle est prélevé l’échantillon.
Sondage : une méthode statistique d'analyse d'une population humaine ou non humaine à partir
d'un échantillon de cette population.
Echantillon : Un sous ensemble de la population considérée, le nombre d'individus dans
l’échantillon est la taille de l'échantillon. Un échantillon doit être une partie représentative de la
population.
Objectif de l’échantillonnage :
Le but d’un échantillon c’est d’obtenir une conclusion sur une caractéristique ou résumé
(paramètre) de la population à partir de l'information de l'échantillon (inférence).
Donc, L’échantillonnage a pour objectif de réduire le coût de la collecte de données sur une population en
réunissant une information provenant d’un sous-ensemble au lieu de la population entière. Les enquêtes par
sondage sont souvent le moyen le plus faisable de réunir les données nécessaires pour l’évaluation des
programmes.
2. Echantillon représentatif :
Un échantillon d’étude quantitative est dit représentatif lorsqu’il possède les mêmes caractéristiques
que la population que l’on souhaite étudier (population mère). Cette représentativité doit surtout se faire sur
les caractéristiques pouvant influencer les réponses.
Faute d’une représentativité suffisante, les résultats obtenus sur un échantillon ne peuvent être généralisés à
la population étudiée.
5
Un échantillon représentatif peut normalement être obtenu par un échantillonnage aléatoire ou par
l’utilisation de la méthode des quotas. Le principe de représentativité est également nécessaire pour les
panels qui sont une forme d’échantillon permanent.
6
II. Choix de démarches d’échantillonnage :
La constitution d’un échantillon peut obéir à différentes démarches. Nombre d’entre elles
peuvent être rattachées à deux démarches génériques : la démarche traditionnelle, caractéristique d’un
échantillonnage probabiliste, et la démarche itérative, telle que celle de la théorie enracinée (Glaser et
Strauss, 1967). Ensuite, quelques démarches particulières peuvent être évoquées.
1. Démarches génériques :
Deux démarches génériques peuvent être distingués : traditionnelle (pour les études plutôt de
nature quantitative) et itérative (pour les études qualitatives).
a. La démarche traditionnelle :
1) Définition de la population :
La population est constituée par l'ensemble des sujets, unités ou objets qui sont potentiellement
concernés par l'enquête. En fonction de l'étude, la population peut être constituée d'un ensemble de
personnes, d'organisations ou d'objets matériels. Il est généralement impossible, voire inutile,
d'effectuer le recueil de données sur l'ensemble de la population. C'est pourquoi on sélectionne une partie
de la population - l'échantillon - sur qui va effectivement porter l'enquête.
- Les méthodes non-probabilistes ou échantillon empirique : Ces méthodes sont utilisées dans le
cas où on ne connait toutes les unités de sondage d’une population et donc lorsqu’il est
7
impossible de mettre en place l’étude sur un échantillon aléatoire. Ces méthodes sont les plus
utilisées lors d'études marketing. Telles que : La méthode des quotas, Les échantillons de
convenance, Les échantillons boules de neige.
- Les méthodes probabilistes ou les échantillons aléatoires : Avec ces méthodes, tous les types
d’individus sont susceptibles d’être interrogés, ce ne sont donc pas forcément des échantillons
qui respectent les quotas mais ils sont plutôt dû au hasard. Telles que : La méthode du tirage au
sort, L’échantillonnage stratifié
Dans la conception des enquêtes répétées dans le temps, une étape essentielle est la détermination
de la taille d’échantillon nécessaire à chaque vague d’enquête. Le mode de calcul de l’échantillon
quantitatif diffère pour chaque méthode statistique utilisée.
La base de sondage est un fichier comprenant l’ensemble de la population étudiée lors d’une
enquête quantitative et au sein duquel sont prélevés par tirage au sort les individus interrogés
(échantillon).
Les éléments qui font partie d’échantillon sont les éléments possédant les informations désirées
pour répondre aux objectifs d’une étude.
La collecte de données vise à rassembler des données, et plus généralement des informations pour
les mettre en forme dans une organisation.
7) Echantillon utile :
Les techniques présentées pour déterminer la taille d’un échantillon ne concernent que la taille de
échantillon utile, à savoir l’échantillon des éléments retenus dans l’analyse statistique. Néanmoins, il
est très rare d’obtenir les informations souhaitées de la part de tous les éléments sélectionnés : cette
proportion des éléments exploitables d’échantillon de départ est appelée le taux de réponse. En
conséquence, il faut tenir compte des non réponses probables, pour déterminer la taille de l’échantillon à
contacter.
8
8) Identification des biais et redressement d’échantillon :
Il est important d’identifier les sources potentielles d'erreur ou biais lors de la planification
d'une enquête par sondage. Un biais ou erreur systématique est une cause d'erreur lors d'une analyse
statistique liée à la méthodologie utilisée.
Si on ne prend pas en compte les biais ou que l'on ne les maîtrise pas, ils peuvent entraîner des erreurs dans
l'estimation des paramètres (surestimation ou sous-estimation).
b. La démarche itérative :
6) Echantillon :
9
2. Démarches non génériques (particulières) :
Royer et Zarlowski listent deux des démarches non génériques : constitution progressive de
échantillon dans une démarche classique ; constitution de échantillon apparié à posteriori.
La constitution de l’échantillon apparié à posteriori constitue une démarche appropriés pour les
évènements rares ou se passant en temps réel ou difficilement indentifiables /accessibles. La constitution
d’échantillon est réalisée donc en fonction des opportunités présentées par le terrain, alors que échantillon
pour effectuer le test de contrôle sera constitué à posteriori.
Déf1 : Ensemble que l'on observe et qui sera soumis à une analyse statistique, chaque élément de cet
ensemble est un individu ou unité statistique.
Déf2 : Ensemble des éléments possédant les informations désirées pour répondre aux objectifs de
l’étude.
10
b. Population finie / population infinie
2. Technique de l’échantillon :
11
a. Techniques probabiliste ou aléatoire :
L’échantillonnage probabiliste repose sur un choix d’unités dans la population fait au hasard, ce n’est pas
l’enquêteur qui choisit les unités, c’est la méthode utilisée pour la sélection qui le fait. Une des caractéristiques de
cette méthode est que chaque unité de la population a une probabilité mesurable d’être choisie.
L’avantage de la méthode d’échantillonnage probabiliste est qu’elle permet de généraliser les résultats de
l’échantillon à l’ensemble de la population en s’appuyant sur une théorie statistique reconnue.
Son seul inconvénient est qu’il faut posséder une liste de toutes les unités formant la population avant de procéder à
la sélection de l’échantillon.
Voici les quatre types d’échantillonnage probabiliste que l’on peut effectuer :
A partir des informations qui permettent de contacter les individus concernés par l’enquête (les numéros
de téléphone ou les adresse mail qui composent ce que l’on appelle la base de sondage de l’enquête), on
va choisir aléatoirement le nombre d’individus requis pour composer notre échantillon. Ici laisser faire le
hasard consiste à ne rien décider
Echantillonnage stratifié :
12
Le chercheur divise la population en sous-groupes distincts et homogènes (strates) à partir desquels il
sélectionnera un échantillon aléatoire simple.
Étapes :
Exemple :
On tire au hasard des grappes ou familles d’individus, et on examine tous les individus de la grappe
(ex: on tire des immeubles puis on interroge tous les habitants). La méthode est d’autant meilleure que les
grappes se ressemblent et que les individus d’une même grappe sont différents, contrairement aux strates.
Le chercheur divise la population en sous-groupes appelés « grappes ». Les grappes ont le même profil, la
variance d’une grappe à l’autre étant faible. Il sélectionne par la suite un échantillon aléatoire de grappes
et non pas un échantillon aléatoire à l’intérieur de chaque grappe.
13
Exemple :
Les étudiants de première année Master à la faculté des sciences économiques et juridique de
TANGER sont répartis en 11 groupes, les groupes sont numérotés de 1 à 11. Supposons que l’on
obtienne les nombres 2, 5, 7 et 10, tous les étudiants de ces 4 groupes feront partie de l’échantillon.
14
Echantillonnage systématique
Dans certaines situations, spécialement lorsque les populations sont importantes, il est coûteux
(en temps) de sélectionner un échantillon aléatoire simple en trouvant tout d’abord un nombre aléatoire et
ensuite en cherchant dans la liste de la population l’élément correspondant. Une alternative de
l’échantillonnage aléatoire simple est l’échantillonnage systématique. Par exemple, si l’on souhaite
sélectionner un échantillon de taille 500 parmi une population contenant 5000 éléments, cela revient à
sélectionner un élément tous les (5000/500) = 10
éléments de la population. Constituer un
échantillon systématique dans ce cas consiste à
sélectionner aléatoirement un élément parmi les 10
premiers de la liste de la population. Les autres
éléments de l’échantillon sont identifiés de la façon
suivante : le second élément sélectionné correspond
au 10e élément qui suit le premier élément
sélectionné dans la liste de la population, le
troisième élément sélectionné correspond au 100e
élément qui suit le deuxième élément sélectionné dans la liste de la population, et ainsi de suite. En fait,
l’échantillon de taille 500 est identifié en se déplaçant systématiquement dans la population et en identifiant
les 10e, 20e, 30e …etc. éléments qui suivent le premier élément choisi aléatoirement .Une fois que vous
aurez numéroté les individus dans votre base de sondage, vous allez en tirer 1 tous les 10. A partir d’un
numéro (l’origine) choisis au hasard.
En ce sens, il serait donc aventureux de généraliser les résultats obtenus pour l’échantillon à toute la
population. Malgré cela, ces méthodes sont souvent utilisées dans certaines disciplines. En voici quelques-
unes :
Echantillonnage de convenance
Par exemple: les études d’opinion réalisées dans la rue, les lieux publics , en sortie de super marché …
Questionnaires figurant les magazines et renvoyés spontanément .
Les échantillons accidentels ne peuvent être considérés représentatifs d'aucune population. Il est risque de
généraliser à une population donnée des résultats obtenus par un échantillon accidentel.
Echantillonnage de jugement
Le chercheur juge que l’échantillon va lui permettre d’atteindre les objectifs de la recherche.
On peut également compenser un échantillon « au jugé » selon les caractéristiques où les
compétences que l’on confère aux individus retenus .l’initiative n’est plus dans le camp des enquêtés, mais
dans celui de l’enquêteur .dans ce cadre, les idées préconçues du chercheur où de l’équipe d’enquêteur
interviennent fortement. Une telle technique d’échantillonnage est intéressante pour mettre ces derniers à
l’épreuve où dans le cadre d’études préalables destinées à tester quelque hypothèse avant de lancer la
véritable enquête.
16
Echantillonnage de boule de neige
Utile dans le cas de la rareté des unités d’échantillonnage ou de l’absence d’un cadre
d’échantillonnage valide. On demande à un répondant de nous référer à un autre qui présente les mêmes
caractéristiques que les siennes.
1. Taille d’échantillon :
Déterminer la taille d’échantillon revient en fait à estimer la taille minimale requise pour obtenir
les résultats avee un degré de confiance satisfaisant. La taille permet d’atteindre la précision ou le seuil de
signification souhaitée pour les échantillons destinées à des traitements quantitatifs, ou une crédibilité
jugée suffisante pour les recherches qualitatives.
a. Echantillon qualitatif :
Comme pour les échantillons destinés à des traitements quantitatifs, la taille d’un échantillon pour
un traitement qualitatif dépend de l’objectif poursuivi. Dans le cadre des études qualitatives, on distingue
généralement les échantillons de taille « un » (particulière à ce type études) et des échantillons qui
comportent plusieurs éléments.
Le statut de Cas unique fait objet de controverses, en ce qui concerne si oui ou non on peut
généraliser à partir d’un cas unique et construire une théorie sur cette base. Yin (1984) estime que le cas
unique peut être assimilé à une expérimentation et distingue trois Situations justifiant l’utilisation d’un
cas unique : test d’une théorie existante, caractère unique ou extrême d’objet étudié, et inaccessibilité
jusqu’alors de l’objet à la communauté scientifique.
Dans la situation des Cas multiples, la confiance accordée aux résultats augmente avec la taille
d’échantillon (ce qui augmente en parallèle le coût de recueil des données).
17
comme les expérimentations multiples, - on peut les choisir par rapport à leur similarité ou, au contraire,
selon le caractère discriminant (Yin, 1984).
b. Echantillon quantitatif:
Le mode de calcul de l’échantillon quantitatif diffère pour chaque méthode statistique utilisée. Les
facteurs qui vont influencer la taille d’échantillon sont nombreux : le seuil de signification, la précision
souhaitée, la variance du phénomène, la technique d’échantillonnage, la taille de population, l’importance
de l’effet étudié, la puissance souhaitée du test et le nombre de paramètres à estimer.
On peut également distinguer deux types d’objectifs pour construire un échantillon quantitatif : la
description d’une population et le test d’une hypothèse.
Alors que la précision est le critère principal de son évaluation, une recherche descriptive d’une
population doit prendre en compte les facteurs suivants : variance de la population (dispersion des
observations) ; seuil de signification (pourcentage de chances de se tromper) ; précision de l’estimation
(intervalle de confiance) ; techniques d’échantillonnage (méthodes échantillonnage modifient la variance
de échantillons) ; taille de population (lorsque le taux de sondage est élevé).
Pour un test d’une hypothèse il est nécessaire de prendre en compte les facteurs de l’importance
de l’effet mesuré (amplitude ou la force de la relation entre les deux ou plusieurs variables) ; puissance du
test (la probabilité de mettre en évidence l’effet étudié), nombre des paramètres (nombre des variables et
d’effets d’interaction que l’on souhaite étudier).
2. Paramètres d’exactitude :
a. Marge d’erreur:
18
- Détermination de l’erreur acceptée : "L’erreur acceptée est le résultat d’un compromis entre la
précision recherchée (le maximum) et le coût de la charge de l’enquête (le minimum)".
-C’est l’expression en pourcentage qui indique la précision désirée. On parle d’intervalle de confiance.
Exemple : Si la question posée est : « avez-vous une voiture? ». Si on obtient 40% de « oui » et on
admet une erreur acceptée =± 5%. Alors, on considérera que les « oui » varient entre 35% (=40%5%) et
45%(=40%+5%).
La marge d'erreur prend uniquement en compte l'erreur de l'échantillon. Elle ne prend pas en compte les
autres sources potentielles d'erreurs, notamment, le biais dans les questions ou dans l'exclusion d'un groupe
n'étant pas questionné, le fait que certaines personnes ne veulent pas répondre, le fait que certaines
personnes mentent, les erreurs de calculs
Cette procédure d’estimation de la taille de l’échantillon n’est valable que pour les méthodes
probabilistes. En effet, d’un point de vue théorique, les méthodes empiriques d’échantillonnage
n’autorisent pas les calculs d’estimation nécessaires à la généralisation des résultats.
b. L’intervalle de confiance :
L’intervalle de confiance est la probabilité que l’échantillon de personnes interrogées ait une
influence sur les résultats de l’enquête. Prenons pour exemple une enquête réalisée avec un échantillon de
cent personnes et un intervalle de confiance de 95 %. Cela signifie que si la même enquête est réalisée une
seconde fois avec cent autres personnes choisies parmi la population cible, les résultats obtenus seront,
dans 95 % des cas, identiques à ceux de la première enquête. L’intervalle couramment utilisé est de 95 %.
Il est déconseillé de prendre un intervalle inférieur à 90 %.
Attention: le niveau de confiance et la marge d’erreur sont seulement valables pour des
échantillons représentatifs et aléatoires.
19
Conclusion :
L’échantillonnage répond a trois questions principales : quelle est la population ; quel est
échantillon qui la représente et comment choisir cet échantillon
Pour qu’un échantillon soit représentatif il faut qu’il possède les mémés caractéristiques de la
population mère pour ne pas influencer les réponses aussi pour généraliser facilement les résultats obtenus
sur la population étudié.
Il est à noter également que l’échantillonnage est aussi important pour la collecte des données
que pour l'analyse et l'interprétation des résultats. Comme l'affirment Miles et Huberman (1994:27), "peu
importe ce que vous ferez, vous ne réussirez jamais à étudier tout le monde partout et dans toutes leurs
activités. Les choix que vous faites (les personnes à qui vous parlerez, où, quand, à quel sujet et pourquoi)
sont autant de limites aux conclusions que vous pourrez tirer, à la confiance avec laquelle vous les
formulerez et au crédit que les autres leur accorderont".
20
Bibliographie et Web graphie :
21
Epistémologies et Méthodologies de Recherche en Sciences de Gestion : Note de Synthèse,
Maya VELMURADOVA Doctorante en Sciences Gestio1ère année, Laboratoire ERMMES,
USTV, Toulon, Novembre 2004.
http://help.evalandgo.com/fr/blog/show/methode-echantillon
https://fr.wikipedia.org/wiki/%C3%89chantillon_(statistiques)
https://fr.checkmarket.com/kb/comment-calculer-la-taille-d-echantillon/
https://www.definitions-marketing.com/definition/echantillon-representatif/
22