Vous êtes sur la page 1sur 22

I n t r o d u c t i o n

L’échantillonnage
L’échantillonnage
à l a r e c h e r c h e

Les objectifs pédagogiques


Reconnaître des erreurs d’échantillonnage
Connaître les qualités d’un échantillon acceptable
Distinguer un échantillon d’un recensement et
reconnaître leurs forces et leurs faiblesses respectives
Connaître les étapes de l’échantillonnage
Connaître les principales méthodes d’échantillonnage
probabiliste et non probabiliste
Reconnaître les erreurs d’échantillonnage
Savoir déterminer la taille d’un échantillon

Le sommaire
1. Un échantillon biaisé
2. Un échantillonnage illustré
3. Quelques définitions
4. L’échantillon par rapport au recensement
5. Les avantages de l’échantillon.
6. Les principes fondamentaux de la théorie de l’échantillonnage
7. Les étapes de l’échantillonnage
8. Les méthodes d’échantillonnage probabiliste
9. Les méthodes d’échantillonnage non probabiliste
10. Les erreurs d’échantillonnage
11. La taille de l’échantillon
12. Je fais mes exercices

Page 1 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
1. Un échantillon biaisé

La conception qu’on se fait d’un échantillon varie d’un individu à l’autre.


Chaque conception s’appuie sur un principe qui la rend juste ou erronée. Avant
de déterminer ce qui confère un caractère scientifique à un échantillon, voyons
pourquoi certaines conceptions peuvent être fausses ou comporter des risques
élevés d’erreurs.

Quelques situations bien concrètes sont présentées de manière à faire ressortir avec plus
d’éclat les erreurs majeures d’échantillonnage.
Votre comité souhaite recueillir la signature des citoyens

!
afin d’appuyer le projet de construction d’un centre
communautaire. Vous recueillez les signatures
à l’entrée de la quincaillerie de votre région.
L’erreur majeure réside dans la sélection des personnes.

X
Les signataires seront en majorité des propriétaires fonciers
d’âge mûr et, probablement, de sexe masculin. Tous les
citoyens ne fréquentent pas la quincaillerie également.

Vous menez une enquête téléphonique sur les habitudes

!
alimentaires des familles. Vous logez vos appels en
matinée le plus souvent, puisque c’est la seule période de
la journée où vous êtes disponible.
Une fois de plus le choix des répondants est biaisé. Les

X
personnes qui travaillent à l’extérieur du foyer seront
systématiquement éliminées de votre enquête. Votre
échantillon sera composé de répondants plutôt homogènes.

Vous êtes chargé par votre conseil municipal d’obtenir

! l’opinion générale de la population sur la cueillette des


ordures ménagères. Vous expédiez un questionnaire
à cet effet par la poste.
Les répondants seront plutôt ceux qui sont fortement

X insatisfaits du service actuel. Un échantillonnage volontaire


peut inciter les personnes vivement intéressées au sujet de
l’enquête à répondre en plus grand nombre.

Vous avez conçu de nouveaux exercices pour votre cours

! de français. Vous décidez d’en faire l’essai auprès de


quelques élèves de votre classe. Vous choisissez des élèves
qui ont un rendement moyen.
Les élèves moyens représentent le groupe des élèves

X moyens et non l’ensemble


des élèves de la classe. C’est un échantillon
sélectif : il n’est pas représentatif.

Page 2 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Il ressort de ces exemples que l’erreur majeure qu’on commet en voulant tirer un
échantillon de la population consiste à attribuer aux individus ou aux unités
d’échantillonnage des probabilités différentes d’être choisis.

Autrement dit, pour qu’un échantillon soit représentatif, il faut que


l’échantillon respecte les proportions entre les caractéristiques constatées et
mesurées dans la population.

2. Un échantillonnage illustré

Dans le tableau suivant, une population a été définie en utilisant des icônes
comme unités d’échantillonnage, au lieu d’individus, de régions, de groupes
professionnels, de classes, et ainsi de suite.

Un premier échantillon a été formé en choisissant la moitié des icônes de


chacune des catégories. C’est ainsi que les proportions entre les catégories
d’icônes dans l’échantillon 1 sont les mêmes que dans la population.

Cependant, pour l’échantillon 2, ces proportions sont loin d’être respectées. On


observe que les écarts entre la population et l’échantillon 2 varient de 11,11 % à
33,33 %. Inutile d’insister sur le fait que les proportions entre les catégories
d’icônes de l’échantillon 2 diffèrent fortement de celles observées dans la
population.
Population
% Échantillon 1 % Échantillon 2 %
12,50 12,50 22,22
18,75 18,75 22,22
6,25 6,25 11,11
37,50 37,50 33,33
25,00 25,00 11,11

Faisons un calcul élémentaire en nous référant au tableau ci-dessus. Nous savons


qu’il y a cinq différentes catégories d’unités d’échantillonnage dans la
population. Chacune possède ses caractéristiques propres. Les voici :

Sachant que cette population est constituée de 32 icônes, chacun d’eux a une
probabilité de 1/32, une proportion de 0,0315 ou un pourcentage de 3,125 % de
faire partie de l’échantillon. Ce calcul est exact si l’échantillon est choisi selon la

Page 3 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
technique d’échantillonnage aléatoire simple. Il existe d’autres techniques
d’échantillonnage que nous expliquerons plus loin.

De plus, vous constatez qu’il existe cinq familles d’icônes dans cette population
et que chacune est présente en nombres différents. La famille d’icônes suivante,
, représente 18,75 % de la population. La probabilité qu’une unité de cette
famille fasse partie de l’échantillon est donc de 18,75 %. En d’autres termes, en
pigeant au hasard 100 icônes dans cette population, vous aurez, de ce nombre,
environ 19 icônes dans votre échantillon (en supposant, bien entendu, que la
population d’icônes soit composée d’au moins 100 icônes…).

? Quelle est la principale qualité d’une unité


d’échantillonnage ?
Le plus petit élément d’une population (p. ex. un individu)
R ne peut posséder qu’une seule probabilité
d’être choisi dans l’échantillon.

Revenons à une population d’êtres humains. Lorsque nous parlons des


caractéristiques de la population, nous faisons allusion à la scolarité, à l’état
civil, au sexe, à la langue maternelle et à de nombreux aspects de ce genre. La
population d’icônes de notre tableau possède, elle aussi, quelques
caractéristiques qui distinguent les icônes entre eux : leur forme, leur couleur, et
leur taille notamment. La notion de caractéristiques de la population est cruciale
dans le domaine de l’échantillonnage. Si vous jugez qu’il est important que la
proportion de femmes dans l’échantillon soit respectée, il vous faudra connaître
cette proportion dans la population. Si la population est composée de 51 % de
femmes, votre échantillon devra être composé, lui aussi, de 51 % de femmes.

La vérification
de la représentativité d’un échantillon
ne peut se faire que
si on connaît bien la population.

Une bonne façon de mettre fin à cette section-ci consiste à vous inviter à
réfléchir sur l’énoncé suivant :

Un échantillon est représentatif


s’il respecte les proportions
entre les caractéristiques
de la population.
Page 4 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
3. Quelques définitions
Avant d’aborder d’autres aspects de l’échantillonnage, il conviendrait de définir
certains termes associés à la science de l’échantillonnage.

Terme Définition Exemple


Unité Élément choisi de la population Un élève, un électeur, une
d’échantillonnage pour faire partie étudiante, un citoyen, une
de l’échantillon. ferme, un commerce
Regroupement d’éléments d’une Les infirmières de la région, les
Échantillon population choisis selon une élèves du secondaire, les
méthode définie. habitants du quartier
Partie de la population totale Les enseignants, les
pour laquelle infirmières, les adolescentes,
Population cible nous voulons généraliser les propriétaires de lots boisés
les résultats de l’échantillon. privés, les accidentés
du travail
La totalité des individus ou des Les êtres humains, les fermes
Population choses partageant certaines du pays, les élèves du primaire,
générale caractéristiques. les citadins
Dénombrement Enquête menée auprès de tous
Recensement des habitants d’un pays. les habitants
Aléatoire Qui tient du hasard. La loterie
La procédure servant à définir la
Schème ou plan population cible, la méthode
d’échantillonnage d’enquête, le choix de l’échantillon,
et les caractéristiques des unités.

4. L’échantillon par rapport au recensement

Pour diminuer le risque d’erreurs d’échantillonnage, vous n’avez qu’à inclure


toute la population dans votre enquête. Les erreurs de toutes sortes seront
réduites à zéro, ou presque.

L’erreur d’échantillonnage, c’est l’écart entre les paramètres de la population


cible et les valeurs estimées de l’échantillon. Les erreurs d’échantillonnage
diminuent à mesure que l’échantillon augmente. Elles atteignent la valeur zéro
lorsque l’échantillon se substitue à la population : l’échantillon comprend la
population cible au complet. Comme le montre le graphique suivant, la
diminution des erreurs est inversement proportionnelle à la racine carrée de la
taille de l’échantillon.

Page 5 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
En augmentant
le nombre d’individus
dans un échantillon,
on diminue ainsi
l’erreur d’échantillonnage.

Vous constatez en même temps qu’il est utopique de penser que pour la moindre
expérience ou enquête il faut faire appel à toute la population. Il n’est donc pas
nécessaire de tenir un recensement pour toute enquête. Un échantillon suffit
amplement, car il présente des avantages intéressants et souvent insoupçonnés.

5. Les avantages de l’échantillon

Premier avantage
Par rapport au recensement, l’échantillon permet de réduire les coûts à bien
des égards. Un recensement mobilise tellement de ressources humaines et
matérielles que seul un pays peut se le permettre à intervalles réguliers.
Deuxième avantage
L’échantillon permet de mieux suivre les unités échantillonnées. Si votre
enquête consiste à rejoindre 250 personnes par téléphone, vous pourrez
aisément exécuter des rappels téléphoniques pour les personnes absentes
lors de votre premier appel.
Troisième avantage
Puisque votre échantillon est restreint, vous pourrez poser un plus grand
nombre de questions aux personnes interrogées.
Ainsi, votre recherche gagnera en qualité.
Quatrième avantage
La quantité de données que vous obtiendrez auprès de votre échantillon pourra
être manipulée aisément à l’aide de la technologie informatique courante.
Aussi, les analyses statistiques seront exécutées avec plus de rapidité.
Cinquième avantage
Si votre échantillon a été tiré selon les règles de l’art, il comportera moins
d’erreurs d’échantillonnage que le recensement. N’y a-t-il pas là contradiction
avec le texte précédent ? L’échantillon ne peut être plus exact que le
recensement, en théorie. Mais, en pratique, les experts soutiennent qu’il est
impossible de rejoindre toute la population dans un court lapse de temps pour
l’interroger à fond. Par contre, si l’échantillon est restreint,
bien peu d’individus choisis échapperont à l’enquête.

Page 6 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
6. Les principes fondamentaux de la théorie de l’échantillonnage

Singh et Chaudhary (1986)


soutiennent que
la théorie de l’échantillonnage
s’appuie sur les trois principes fondamentaux suivants :

1. Le principe de validité
Selon ce principe, l’échantillonnage doit permettre d’obtenir une estimation
valide des paramètres de la population. L’estimation des paramètres sera
valide pour autant que soit connue au préalable la probabilité de chaque individu
de faire partie de l’échantillon. Un paramètre est une caractéristique mesurée de
la population, p.ex. la langue parlée au foyer, l’état civil, la scolarité, et ainsi de
suite.

2. Le principe de constance statistique


La nécessité et l’importance de choisir un individu comme membre de
l’échantillon doivent découler de la théorie des probabilités, et non d’autres
considérations. Ainsi, on prétend qu’un groupe assez nombreux d’individus
choisis au hasard comportera les mêmes caractéristiques que celles de la
population d’où il origine.

3. Le principe d’optimisation
L’optimisation des résultats consiste à obtenir le maximum d’efficacité avec le
minimum de ressources et de dépenses. Sans jamais perdre de vue la réduction
des erreurs d’échantillonnage, il faut réduire les coûts et éviter les dépenses
inutiles d’énergie pour former un échantillon représentatif.

Ces principes n’ont de valeur que si tout est mis en œuvre pour qu’ils soient
respectés. Ils sont bien plus que des vœux pieux. La technique d’échantillonnage
que vous utilisez doit respecter la loi des probabilités coûte que coûte si vous
voulez être capables de généraliser les résultats obtenus auprès de votre
échantillon à la population générale. Sinon, votre recherche ou votre enquête
aura servi à décrire un groupe quelconque de personnes et non un échantillon.

? Lequel de l’échantillon ou du recensement


coûte le plus cher ?

Page 7 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Le coût total d’un recensement est plus élevé que celui d’un
R échantillon. Par contre, le coût par unité est moins élevé
pour un recensement que pour un échantillon.

7. Les étapes de l’échantillonnage

Former un échantillon n’est pas une tâche simple. Elle n’est pas à prendre à la
légère. Il vaut mieux suivre une démarche systématique car il y a des tâches à
exécuter auxquelles on ne peut se soustraire. Par conséquent, puisque ces tâches
doivent être effectuées, aussi bien les accomplir avec soin.

Plusieurs auteurs consultés proposent une démarche plus élaborée que la


suivante. Nous avons réduit cette démarche aux étapes les plus essentielles. Il
n’est pas nécessaire d’utiliser un bulldozer pour remuer la terre de votre potager.

1. Énoncer les objectifs


Le but de l’échantillon doit faire état de la raison sociale de l’échantillon, des
ressources matérielles et financières qui y seront affectées et des limites qui
seront imposées.

2. Définir la population
Les caractéristiques qui représentent un intérêt vital doivent être décrites (p. ex.
l’âge des individus, le sexe, leur état civil, leur niveau de scolarité, leur lieu de
résidence, leur statut socioéconomique, et bien d’autres encore). De toute
évidence, plus vous souhaitez que l’échantillon possède des caractéristiques
similaires à la population cible, plus vous devrez augmenter la taille de votre
échantillon afin de diminuer les différences entre les deux.

3. Déterminer les unités d’échantillonnage


Cette fonction est cruciale et déterminante parce qu’elle permet de définir,
d’isoler et de choisir chaque membre de l’échantillon selon une probabilité
préétablie. C’est l’opérationnalisation de l’échantillon.

4. Choisir un schème d’échantillonnage


Comme plusieurs schèmes d’échantillonnage peuvent être adoptés, il suffit
de les comparer entre eux afin de déterminer celui qui respecte de plus près
le principe d’optimisation.

5. Appliquer le schème d’échantillonnage


Il ne suffit pas de planifier avec précision, il faut aussi exécuter avec
justesse. La valeur du schème d’échantillonnage tient autant à son application

Page 8 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
qu’à sa conception. Les personnes chargées de faire la collecte des données,
par exemple, devront exécuter les tâches requises selon une procédure
systématique et uniforme. S’il a été décidé d’interroger les individus au
moyen d’un questionnaire écrit, elles ne peuvent en interroger quelques-uns
d’entre eux par des entrevues téléphoniques.
8. Des méthodes d’échantillonnage probabiliste

Une fois que vos objectifs d’échantillonnage ont été éclaircis et que votre
population a été définie, il ne reste plus qu’à choisir les unités d’échantillonnage.

Votre objectif consiste à interroger les directrices et les directeurs


d’école de votre province. Ils sont au nombre de 147.
Vous décidez de former votre échantillon
à partir de 25 % de cette population,
soit en choisissant 37 d’entre eux.
Vous obtenez du ministère de l’Éducation
la liste complète des 147 individus.
Quelle méthode d’échantillonnage allez-vous utiliser pour former un
échantillon de 37 d’entre eux ?

Vous utiliserez l’un des deux types de méthodes d’échantillonnage suivants :

L’échantillonnage probabiliste
1 Quant à ce type d’échantillonnage, on accorde une probabilité
quelconque à chaque unité de faire partie de l’échantillon.
L’échantillonnage non probabiliste
Devant l’impossibilité d’assigner à chaque individu une probabilité d’être
choisi pour faire partie d’un échantillon, il arrive qu’on doive

2
faire une sélection au mieux de notre connaissance.
En général, après un examen de la population cible, la décision est prise de
faire appel à un groupement d’individus considérés comme typiques de cette
population. Cette sélection découle d’un jugement et
comporte des risques d’erreurs imminents.
L’utilité des résultats de la recherche auprès d’un échantillon probabiliste
dépendra de la similitude entre l’échantillon et la population visée.

Page 9 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Vous considérez que choisir les directrices et les directeurs
d’école au hasard vous amènerait à voyager sur de trop longues
distances.
Vous décidez plutôt d’utiliser une technique d’échantillonnage
non probabiliste. Pour ce faire, votre population cible deviendra
les directions d’école habitant la partie nord de la province, là
où vous demeurez. Vous établirez la liste de ces individus à
partir de laquelle vous en choisirez, au hasard, 37.
Selon vous, les directions d’école du nord sont, à toutes fins utiles,
semblables à celles du sud de la province.

Le tableau suivant vous aidera à faire la distinction entre une méthode


probabiliste et une méthode non probabiliste d’échantillonnage. Pour chacune de
ces deux catégories nous énumérons les techniques les plus courantes.
Méthode d’échantillonnage probabiliste
L’échantillonnage aléatoire simple
L’échantillonnage systématique
L’échantillonnage stratifié
L’échantillonnage par grappes
Méthode d’échantillonnage non probabiliste
L’échantillonnage à l’aveuglette
L’échantillonnage de volontaires
L’échantillonnage au jugé
L’échantillonnage par la méthode des quotas

Pour des informations complètes sur chacune de ces techniques, et sur d’autres
techniques, nous vous conseillons la référence suivante : A. Satin et W. Shastry
(1993). L’échantillonnage : un guide non mathématique. Statistique Canada,
ministère de l’Industrie, des Sciences et de la Technologie. La bibliographie
contient quelques autres références tout aussi utiles. Comme certaines
techniques sont plus utilisées que d’autres, nous les expliquerons plus en détail.
Pour les autres, nous nous contenterons de les définir.

8.1 L’échantillonnage aléatoire simple

Description : Chaque unité de la population a la même chance d’être choisie


dans l’échantillon.

Exemple : Vous souhaitez interroger les propriétaires de petites et de moyennes


entreprises de votre région. Vous en dressez une liste complète. Par une pige au
hasard, vous en choisissez 20 % d’entre eux à qui vous expédiez un
questionnaire écrit portant sur les exportations.

Page 10 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Supposons qu’il y ait 10 entreprises de taille moyenne ( ) et 20 petites
entreprises ( ) dans votre région. Afin de respecter vos objectifs
d’échantillonnage, votre échantillon aléatoire devrait être constitué de deux
entreprises moyennes et de quatre petites entreprises. Dans le tableau qui suit,
les entreprises choisies sont représentées par les cases colorées .

8.2 L’échantillonnage systématique

L’échantillonnage aléatoire simple est la technique préférée entre toutes, mais il


est fastidieux à appliquer lorsque la population est nombreuse. On lui préfère
souvent l’échantillonnage systématique.

Description : Les unités sont choisies dans une liste selon une séquence
déterminée au préalable. D’abord, vous établissez une liste exhaustive des
unités. Ensuite, vous entamez la sélection avec, comme point de départ, une
unité choisie au hasard. Enfin, vous avancez dans la liste en sélectionnant l’unité
située à une distance fixe de la dernière unité choisie.

Exemple : Comme l’annuaire téléphonique contient la quasi-totalité des


individus de votre région, vous en faites votre liste de base. Comme 25 013
noms figurent dans l’annuaire et que votre échantillon sera composé de 1 250
individus, vous devrez choisir un nom dans chaque bloc de 20 individus. Le
hasard veut que vous commenciez au septième abonné téléphonique. Votre
deuxième unité sera le 27e abonné, la troisième unité sera le 47e, et ainsi de
suite.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

8.3 L’échantillonnage stratifié

Page 11 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
L’échantillonnage aléatoire simple ne requiert aucune connaissance des
caractéristiques de la population. Au contraire, l’échantillonnage stratifié
consiste à regrouper les individus en sous-groupes appelés strates selon une ou
plusieurs caractéristiques.

Description : La population est subdivisée en groupements homogènes selon


une ou plusieurs caractéristiques. Ensuite, un échantillon aléatoire est tiré de
chaque groupement ou strate. Cette technique permet d’obtenir des groupements
plus homogènes quant à une caractéristiques, réduisant ainsi la variance due à
des cas extrêmes. Elle permet surtout de s’assurer de la représentativité de
chacun des groupements.

Exemple : La population cible de votre enquête est le personnel scolaire. Vous


souhaitez interroger les catégories suivantes d’employés : administrateurs (A),
directeurs d’école (D), enseignants (E), conducteurs d’autobus (C) et préposés à
l’entretien ménager (P). En établissant ces catégories vous voulez vous assurer
d’obtenir des données suffisantes pour chacune d’elles sans être obligé
d’augmenter fortement le nombre d’individus dans l’échantillon. Un échantillon
aléatoire pourrait comprendre un nombre respectable d’enseignants, mais le
nombre absolu de préposés à l’entretien ménager ne permettrait pas des analyses
statistiques valides.

Cette technique d’échantillonnage permet, si vous le désirez, d’imposer à


chaque strate une sorte de quota : vous pouvez décider de choisir, pour une
strate particulière, 20 % des individus au lieu de 10 % comme dans une autre
strate. Dans l’exemple qui suit, les enseignants sont proportionnellement plus
nombreux que les employés des autres catégories. Vous parviendrez peut-être à
un degré de précision acceptable en choisissant 3 % des enseignants (E).
Comme les préposés à l’entretien ménager (P) sont peu nombreux, pour parvenir
au même niveau de précision vous serez peut-être obligé de choisir 15 % d’entre
eux.

Population Strates Échantillon


C PP E E A AAAA A
D C C DE E EC DDDDDD DD
P D A C C E E A EEEEEEEEEEEEEEEE EEEE
E E ECE D P AC CCCCCCCCC CC
EDE EE C D DE PPPP A

8.4 L’échantillonnage par grappes

Page 12 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Description : Lorsque des unités de la population sont regroupés selon une
hiérarchie quelconque, c’est de l’échantillonnage par grappes. Ce type
d’échantillonnage permet d’identifier et de choisir des regroupements
homogènes d’individus.

Exemple : Les élèves appartiennent à une classe. Les classes sont regroupées
par niveau. Plusieurs niveaux constituent une école. Plusieurs écoles font partie
du district scolaire. Une grappe, ce peut être une classe, un niveau, une école.

L’échantillonnage par grappes offre l’avantage d’avoir accès à peu de frais à un


grand nombre d’unités. Le choix des unités d’échantillonnage ne se fait pas à
partir des unités, mais en fonction d’une catégorie d’unités. Au lieu d’une
liste exhaustive d’élèves du primaire de votre région, vous choisissez quelques
classes au hasard. À cause de l’homogénéité des élèves d’une région,
l’échantillonnage par grappes est tout aussi efficace que l’échantillonnage
aléatoire simple.
Échantillonnage par grappes
École XYZ
Niveaux 1 2
Classes A B D E
Élèves

Dans le tableau précédent, les icônes représentent les élèves. Les classes sont
assez semblables entre elles, si bien que vous pourriez choisir une classe au
hasard. Un niveau complet pourrait tout aussi bien servir de grappes. En
choisissant un niveau, toutes les classes appartenant à ce niveau feront alors
partie de l’échantillon.

9. Les méthodes d’échantillonnage non probabiliste

9.1 L’échantillonnage à l’aveuglette

Les méthodes d’échantillonnage non probabiliste, bien que moins coûteuses et


plus pratiques, sont moins exactes. Bien des experts dans le domaine
recommandent de s’en éloigner. Ces méthodes supposent que les
caractéristiques de la population sont distribuées de manière aléatoire. C’est
peut-être vrai dans certains cas, mais pas dans tous les cas.

Le biologiste qui prend un échantillon d’eau dans un lac exerce


l’échantillonnage à l’aveuglette. Il prétend que les produits chimiques sont
Page 13 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
répandus également partout dans le lac. Il en est de même pour l’épicier qui
goûte à une seule pomme au comptoir de fruits.

9.2 L’échantillonnage de volontaires

Certaines recherches ne pourraient s’exécuter autrement qu’en faisant appel à


des volontaires. Les compagnies pharmaceutiques font appel à des volontaires
qu’ils paient aussi afin de vérifier les effets de leurs nouveaux produits.

Un groupe de volontaires risque d’être plus homogène qu’un groupe tiré au


hasard dans la population, offrant ainsi moins de variabilité qu’on le souhaite.

9.3 L’échantillonnage au jugé

Cette méthode est plus souvent utilisée qu’on le croit. Pour des raisons
pratiques, les chercheurs décident de tenir un sondage auprès de la population
scolaire d’un seul district. Ils qualifient ce district de typique, en ce sens qu’il
possède les caractéristiques de la majorité des autres.

Une conseil municipal choisit de tenir son enquête socioéconomique dans un


seul quartier de la ville, prétextant que ce quartier choisi ressemble à la majorité
des autres. En considérant le rapport coûts/bénéfices, il n’y a pas d’avantages à
étendre leur enquête à un deuxième quartier.

9.4 L’échantillonnage par la méthode des quotas

La méthode des quotas est populaire dans les études de marketing, entre autres.
La sélection des unités est faite de manière à respecter dans l’échantillon les
proportions associées à chacune des caractéristiques observées dans la
population. Les enquêteurs vont s’assurer, par exemple, que chaque groupe
d’âge est bien représenté, c’est-à-dire dans les mêmes proportions que dans la
population. Au contraire de l’échantillon aléatoire qui ne permet pas de prédire
qui fera partie de l’échantillon, la méthode par quotas fait un choix
judicieux des individus selon qu’ils possèdent une ou plusieurs
caractéristiques recherchées.

10. Les erreurs d’échantillonnage

Page 14 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Pour n’importe quel échantillonnage, des erreurs surviennent. Elles sont
inévitables. Par contre, elles peuvent être réduites de plusieurs manières, surtout
en augmentant la taille de l’échantillon. Plus on se rapproche de la population,
plus les erreurs d’échantillonnage diminuent.

Il existe deux catégories d’erreurs : les erreurs systématiques dues à


l’échantillonnage et les erreurs dues au hasard, à d’autres facteurs que
l’échantillonnage. Voyons d’abord en quoi consistent les erreurs systématiques
d’échantillonnage.

Description de l’erreur no 1
Accorder une plus grande chance à certaines unités
d’être choisies dans l’échantillon
Exemple
Votre technique d’échantillonnage consiste à frapper aux portes d’une section de votre ville
durant le jour. Nous savons, par ailleurs, que certains quartiers des villes sont habités par des
segments de population plutôt homogènes. Les personnes âgées tendent à demeurer dans un
secteur particulier, tandis que les jeunes familles se trouvent en plus grand nombre dans un
autre quartier. Les personnes âgées ont plus de chance d’être présentes à leur foyer le jour que
les jeunes couples qui occupent des emplois.
Description de l’erreur no 2
Un échantillon en apparence tiré au hasard
Exemple
Les sujets de votre enquête ont été sélectionnés en choisissant un abonné téléphonique à
chaque cent abonnés. Comme c’est le nom du père qui figure le plus souvent dans l’annuaire
téléphonique, vous risquez de vous retrouver avec un échantillon disproportionné quant au
sexe : votre échantillon souffrira d’une sur-représentation des hommes.
De plus, les noms de tous les citoyens ne figurent pas tous dans l’annuaire téléphonique.
Description de l’erreur no 3
Substituer une unité pour une autre
Exemple
Selon votre plan d’échantillonnage, vous devez interroger une femme habitant au 1248, rue
Principale. Comme elle n’est pas présente lors de votre passage, et afin d’éviter de retourner à
cette adresse, vous allez frapper à la porte de sa voisine. Votre critère de sélection devient
alors la proximité géographique et non plus les lois du hasard.
Description de l’erreur no 4
La nature intrinsèque de votre technique d’échantillonnage favorise
certaines unités plus que d’autres
Exemple
Page 15 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Vous expédiez par la poste un questionnaire qui porte sur la venue d’une maison de jeu dans
la région. Les personnes qui s’adonnent déjà aux jeux de hasard vont certainement répondre
en plus grand nombre. Il se peut aussi que les personnes farouchement opposées à ces jeux
fassent des démarches systématiques pour inciter les autres opposants à répondre au
questionnaire. Dans tous ces cas, chaque unité n’a pas la même probabilité d’être choisie dans
l’échantillon. Ce biais d’échantillonnage survient surtout dans les situations où la volonté de
chaque unité entre en jeu : une personne peut choisir de participer à l’enquête,
ou de ne pas y participer.

Il y a erreur d’échantillonnage lorsque les valeurs de l’échantillon s’écartent de


celles de la population. Pour un échantillonnage probabiliste, il est possible de
mesurer ce degré d’erreur. Les erreurs d’échantillonnage n’invalident pas
l’échantillon. Du moins, lorsque nous pouvons calculer le degré d’erreur, nous
pouvons affirmer que les valeurs de l’échantillon se situent à l’intérieur d’une
zone de valeurs probables. C’est ainsi qu’on parle des marges d’erreur.

Admettons que la moyenne de votre échantillon soit de 73 à une variable


quelconque. La science de l’échantillonnage vous indiquera que, en fait, la vraie
moyenne se situe entre 70 et 76 dans 95 % des cas. On peut le dire autrement :
pour 19 échantillons sur 20, la moyenne sera située parmi les valeurs comprises
entre 70 et 76.

L’inconvénient d’un échantillonnage non probabiliste, c’est l’impossibilité de


calculer ce degré de précision. Pour de la recherche sérieuse, il faut éviter
l’échantillonnage non probabiliste.

11. La taille de l’échantillon

La sempiternelle question de la taille de l’échantillon finit toujours par surgir.


Combien d’unités d’échantillonnage sont nécessaires pour que l’échantillon soit
représentatif ? Une réponse facile à donner, mais vague en même temps,
s’énonce comme suit : plus grand sera l’échantillon, plus précise sera
la généralisation des résultats !

En fait, ce n’est pas une réponse pratique, mais plutôt un principe directeur à
suivre dans la plupart des cas. La détermination de la taille de l’échantillon se
fait en tenant compte de plusieurs facteurs ; les coûts, la précision désirée dans
les estimations, les ressources humaines et matérielles disponibles, le temps dont
le chercheur dispose et l’accessibilité aux unités d’échantillonnage.

Page 16 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Encore là,
ce n’est pas très clair
ce qu’il faut faire.
La raison de cette confusion,
c’est qu’il n’y a pas
qu’une seule et unique réponse
à cette question.

11.1 Le degré de précision

Malgré tout, le principal facteur qui sert à déterminer la taille d’un échantillon
est la précision souhaitée dans l’estimation des valeurs statistiques de
l’échantillon. Ces valeurs de l’échantillon doivent se rapprocher le plus possible
de celles que nous connaissons de la population.

Il est crucial de savoir qu’en augmentant progressivement la taille de


l’échantillon la précision des estimations n’augmente pas de façon
proportionnelle. Il existe des tables conçues pour nous indiquer la taille de
l’échantillon pour chaque degré de précision que nous souhaitons. Ces tables
sont de plus en plus remplacées par des logiciels conviviaux.

Par exemple, pour une population de 100 000 unités, à un niveau de précision de
0,05, la taille requise de l’échantillon est de 383. Par ailleurs, si votre population
est de 20 000 unités, votre échantillon, lui, diminuera à 377. Si votre population
est de 200 unités, il vous faudra tout de même choisir 132 unités
d’échantillonnage. Assez étonnant, n’est-ce pas ? Et c’est peu dire ! Le tableau
suivant vous aidera à comparer ces valeurs.

Population Échantillon Rapport


200 132 132/200=0,660
20 000 377 377/20 000=0,019
100 000 383 383/100 000=0,004

Si vous désirez augmenter le degré de précision des estimations de 0,05 à 0,01,


pour une population de 100 000, votre échantillon devra passer de 383 à 8 762
unités. Votre échantillon devra être plus de 22 fois plus grand pour ajouter
4 points de précision. L’évidence même saute aux yeux ! Il faut donc parfois
sacrifier de la précision pour que la recherche se réalise.

Degré de précision
Page 17 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
0,05 0,01
Population 100 000 100 000
Échantillon 383 8 762

11.2 La variabilité des caractéristiques dans la population

La qualité principale d’un échantillon réside dans sa représentativité, sa


similitude avec la population mère d’où il tire son origine. Plus l’échantillon est
grand plus la représentativité augmente. Par ailleurs, plus il y a de variabilité
dans la population par rapport aux caractéristiques ciblées, plus grand devra
être l’échantillon de sorte que toutes les caractéristiques soient bien
représentées.

Le pomiculteur, à l’automne, ne goûte pas à une pomme de


chacun de ses pommiers. Quelques-unes cueillies ça et là
suffisent amplement, car la variabilité entre le degré de
mûrissement des pommes est réduite.
Par contre, lorsqu’il s’agit de mesurer l’intelligence des enfants
de 12 ans, il faudra un échantillon assez nombreux pour que
tous les niveaux d’intelligence soient bien représentés.

11.3 Les ressources humaines, financières et matérielles disponibles

Les contraintes en recherche sont nombreuses et bien réelles. Le problème


original doit souvent être dégrossi de manière à rendre la recherche faisable.
Pour exécuter bien des analyses statistiques, on doit s’assurer d’un nombre
minimum d’individus dans l’échantillon. Dans plusieurs de ces cas, il faut
calculer 10 individus pour chacune des variables qui fait partie d’une analyse. Il
n’est pas rare qu’on doive s’abstenir de faire certaines analyses parce que la
taille de l’échantillon ne le permet pas.

Chaque variable que vous ajoutez à un questionnaire a un prix. Elle occasionne


des dépenses supplémentaires de toutes sortes et souvent insoupçonnées. Une
recherche qui se limite à des variables essentielles a plus de chances de se
faufiler entre toutes sortes de difficultés liées aux ressources humaines et
financières. Il n’est pas étonnant que votre cadre conceptuel doive être tricoté
serré si vous voulez que votre recherche soit complétée.

11.4 Quelques règles générales

Quand il s’agit de déterminer la taille d’un échantillon probabiliste, on a recours


le plus souvent à des formules mathématiques. En examinant les tables conçues
Page 18 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de
Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
pour déterminer la taille d’un échantillon, on constate d’emblée qu’à partir d’une
population de 1 000 individus il n’est pas nécessaire d’augmenter la taille de
l’échantillon pour s’assurer d’un degré de précision supérieur.

Le tableau ci-dessous vous aidera à mieux comprendre que la relation entre la


taille de l’échantillon ne partage pas une relation linéaire avec la taille de la
population.

Population Échantillon
100 ou moins plus de 50 %
101 à 500 25 à 50 %
501 à 1 000 10 à 25 %
1 001 à 1 000 000 1 à 10 %

La section
Je fais mes exercices
à la page suivante

Page 19 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
12. Je fais mes exercices

1. Vous formez un échantillon à l’aide de la technique aléatoire simple. Par


conséquent, plus vous augmenterez le nombre de sujets dans l’échantillon plus
la représentativité de votre échantillon augmentera.
O Vrai O Faux

2. Peu importe la taille de votre échantillon, l’erreur d’échantillonnage est


constant.
O Vrai O Faux

3. L’échantillonnage aléatoire simple est la seule technique d’échantillonnage


valable.
O Vrai O Faux

4. L’annuaire téléphonique de votre région constitue une liste valide de la


population et il peut servir à choisir un échantillon.
O Vrai O Faux

5. Une classe d’élèves choisie pour votre échantillon constitue :


O Une strate O Une grappe

6. Lorsque vous demandez à vos collègues de classe de se soumettre à une


expérience quelconque, c’est alors un échantillonnage à l’aveuglette.
O Vrai O Faux

7. Quand est-ce préférable de faire un recensement plutôt que de choisir un


échantillon ?

Page 20 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
8. Vous êtes chargé de mesurer la pureté de l’eau dans votre ville. Élaborez un
plan d’échantillonnage. Quels facteurs devrez-vous tenir compte ?

Bibliographie

Angers, Maurice . Initiation pratique à la méthodologie des sciences humaines.


Anjou (Québec): Les Éditions CEC Inc., 1996.
Barnett, Vic. Sample Survey Principles and Methods. New York: Oxford
University Press, 1991.
Dayhaw, Laurence T. Manuel de statistique. Ottawa: Éditions de l’Université
d’Ottawa. 2e édition, 1963.
Ferguson, George A. Statistical Analysis in Psychology and Education. New
York: McGraw-Hill Book Co. 2nd edition, 1966.
Fortin, Marie-Fabienne. Le processus de la recherche: de la conception à la
réalisation. Ville Mont-Royal (Québec): Décarie Éditeur Inc., 1996.
Foucault, Luc, et Lucie Verreault. Guide d’élaboration d’un programme de
formation documentaire. Montréal: Conférences des recteurs et des
principaux des universités du Québec, 1994.
Hair, Joseph F. Jr., Rolph E. Anderson, and Ronald L. Tatham. Multivariate
Data Analysis. 2nd edition. New York: Macmillan Publishing Co., 1987.
Hayduk, Leslie A. Structural Equation Modeling with Lisrel. Baltimore: The
John Hopkins University Press, 1987.
Hays, William L. Statistics for Psychologists. New York: Holt, Rinehart and
Winston, 1963.
List, Carla. Introduction to library research. New York: McGraw-Hill, 1993.

Page 21 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9
Létourneau, Jocelyn. Le coffre à outils du chercheur débutant. Guide d’initiation
au travail intellectuel. 70 Wynford Drive, Don Mills, Ontario M3C 1J9:
Oxford University Press, 1989.
Marcil, Claude, et Robert Chiasson. Comment chercher: les secrets de la
recherche de l’information. Québec: MultiMondes, 1992.
McCall, Chester H. Jr. Sampling and Statistics Handbook for Research. 1st
edition. Ames, Iowa 50010: The Iowa State University Press, 1982.
Nunnally, Jim C. Psychometric theory. New York: McGraw-Hill Book Co. 2nd
edition, 1978.
Ouellet, André. Processus de recherche: une approche systémique. Québec:
Presses de l’Université du Québec, 1981.
Rice, James Jr. Teaching library use: a guide for library instruction. Westport,
Connecticut: Greenwood Press, 1981.
Satin, A., et W. Shastry. L’échantillonnage: un guide non mathématique.
Ottawa: Statistique Canada, ministère de l’Industrie, des Sciences et de la
Technologie, 1993.
Scheaffer, Richard L., William Mendenhall, and Lyman Ott. Elementary Survey
Sampling. Boston: Duxbury Press, 1979.
Singh, Daroga, and F. S. Chaudhary. Theory and Analysis of Sample Survey
Design. New York: John Wiley & Sons, Inc., 1986.
Stuart, Alan. Basic Ideas of Scientific Sampling. High Wycombe: Charles
Griffin & Co. Ltd., 1976.
Tabachnik, Barbara G., and Linda S. Fidell. Using Multivariate Statistics. New
York: Harper & Row, 1983.
Williams, Bill. A Sampler on Sampling. New York: John Wiley & Sons, Inc.,
1978.

Page 22 Introduction à la recherche Donald Long longd@umoncton.ca (506) 858-4886 Centre de


Recherche et de Développement en Éducation (CRDE) Université de Moncton, N.-B. Canada E1A 3E9